LC关联数据批下载更新

美国国会图书馆(LC)2009年上线id.loc.gov网站,陆续以关联数据形式提供该馆维护的各类词表和书目、规范数据,后来又开始陆续提供数据的批下载。发布的数据可以查询或关联使用,下载的数据还可以整合到自己的应用中。

今天在BIBFRAME邮件组中看到消息,称其中的LCSH(国会图书馆标题表)和LCNAF(名称规范档)已更新,并将持续定期更新:

  • LCSH:每周三更新(如果有变化)
  • LCNAF:每月15日更新
  • 二者均以JSON-LD、N-Triple和XML序列化。

The Library of Congress > Linked Data Service > Download

目前LC关联数据服务的批下载页面有各种主题词表、名称规范、代码表(编目条例、国别、地理区域、语种、体裁、关系词等)数十种,序列化为RDF/XML、Turtle或N-triples。文件大小从数KB到十数GB不等,通常为压缩文件,解压后可能增大10倍。每个文件都显示更新日期。相关背景信息见LC关联数据服务的技术中心(Technical Center),包括:下载数据处理方法、元数据结构标准、搜索使用与SPARQL查询方法、支持的RDF MIME类型和序列化格式。

参见:

BIBFRAME工具强化:MARC题名规范记录转换为BIBFRAME作品

LC最近对BIBFRAME工具进行了强化,主要是增加了MARC题名和名称/题名规范记录转换为BIBFRAME作品描述部分,包括3个部分:
1、说明书,链接在“MARC21到BIBFRAME 2.0转换说明书”中:
MARC 21 to BIBFRAME 2.0 Conversion Specifications
Process notes – R2 (Word, 28 KB, 07/27/2017)
MARC Title Authority Conversion Specifications
Authority Info: Name/Title and Title – R0 (Excel, 33 KB, 07/28/2017)
根据使用说明(Usage Notes),上述转换说明书(映射表)省略了不适用于题名规范的MARC字段。对原来的“处理注释”说明书(Process Notes)增补了转换MARC题名规范为BIBFRAME作品所需的注释(见上)。

2、转换程序,放在Github上,marc2bibframe2的with-auths部分:https://github.com/lcnetdev/marc2bibframe2/tree/with-auths

3、对照阅读器:http://id.loc.gov/tools/bibframe/compare-lccn/full-ttl?find=n79132705
就是原来的BIBFRAME比较工具,选择LCCN(而非书目ID),可以看MARC规范记录及转换为BIBFRAME的情况

LC每天使用这些工具开发与调整其BIBFRAME 2.0试验,因此在不断更新纠错中。

via [BIBFRAME] BIBFRAME tools relating to MARC title Authority records / McCallum, Sally. 2017-12-1

IFLA《规范记录与参照指南》笔记(附ISADN)

GUIDELINES FOR AUTHORITY RECORDS AND REFERENCES / Revised by the IFLA Working Group on GARE Revision. Second Edition. München : K.G. Saur, 2001

《规范记录与参照指南》简称GARR,1984年第1版题名《规范与参照款目指南》(Guidelines for Authority and Reference Entries),简称GARE
作为IFLA关于规范数据的标准,GARR主要供支持全球书目控制(Universal Bibliographic Control,UBC)项目的国家书目机构使用。UBC由1974年联合国教科文组织政府间会议确立,国家书目机构有责任“建立本国作者(含个人和团体)名称的规范形式,以及本国作者、个人和团体的规范表”。
GARR所称的“规范”范围包括个人、团体和作品/内容表达,有3种款目形式:规范记录/款目、参照款目和一般解释款目。GARR的作用和形式大致可对应于著录方面的《国际标准书目著录》(ISBD),规定了规范系统的结构,包括所用元素、排列顺序和前置标识符。但GARR不规定标目、参照、附注等的实际形式,这些信息由国家书目机构及编目规则决定,遵循IFLA的其他文件如《个人名称》和《匿名经典》。

规范记录的7大项及前置标识符如下:
1、规范标目项:规范标目 = 并列标目/链接规范标目
2、信息附注项:公共附注
3、见参照根查项: < 根查
4、参见参照根查项: << 根查
5、编目员附注项
6、来源项:编目机构名称 ; 编目规则或标准 , 日期
7、国际标准规范数据号项:ISADN [曾有计划但未实现]

如前所述,GARR(及前版GARE)不涉及如何确定规范形式。但由Barbara B. Tillett撰写的本版“导言”,引用“最小级规范记录与国际标准规范数据号工作组”(IFLA UBCIM Working Group on Minimal Level Authority Records and the ISADN, MLAR)在1998年报告中的认识,对规范形式问题作了前瞻性的解说。摘译如下:
MLAR在1998年报告中认识到,IFLA要求每个人对全球标目使用相同形式的UBC目标,既不实际也不再有必要。随着计算机能力发展日趋成熟,一个国家根据一套编目规则创建的规范记录,可以链接到另一个国家的记录,以方便共享规范记录,并有潜力由计算机辅助调节显示规范形式。
MLAR认识到,“要求每个人对全球标目使用相同形式的IFLA的UBC目标,既不实际也不再有必要”。上述陈述基于一个事实,“有理由使用最终用户熟悉的名称形式,以他们可以阅读的文字,以他们最可能在图书馆目录或国家书目中查找的形式。因此,本工作组认识到,重要的是允许保留基于国家或规则的、在国家书目和图书馆目录中所用标目规范形式上的差异,以满足特定机构用户的语言与文化需要。”
这个意在保留标目规范形式差异的新原则,现在必须与另一原则相关,即作为目录在本地或地区环境中基本需求的检索(点)一致性,无论是传统卡片目录还是国家书目,或者在自动化系统和互联网上。如今,这一需求的范围与功能可通过开发链接所有相关规范记录的不同自动化方式实现,以前需要但要全球一致性不切实际的,将可以达成。统一标目的概念,在应用相同编目规则的环境中仍然有效,现在则有了一个以不同方式实现此功能的新定义。通过本国传统及自动化目录与书目所用的检索(点)一致性,也通过多文档多国环境中的链接方法,检索者/用户查寻时在搜索、查找和识别上得到帮助。除了使用全球一致形式,通过允许查询与显示所有形式的链接机制,我们将达到同样功能。

[update]关于国际标准规范数据号(International Standard Authority Data Number, ISADN)
本文件规定在规范记录中包含一个国际标准规范数据号(ISADN),但未给出关于其形式或结构的细节。在分阶段执行国际规范系统的初始总体计划中,工作组原计划需要这样一个数字,特别是为自动处理机读记录提供便利。不过,有关如何构建这样一个号码,以及如何控制规范机构分配号码等细节,仍有待制订。实际上,正在重新考虑国际标准号的必要性,作为对初始总体计划的审查的一部分,而且可以确定,分配和指定这些号码的实际障碍超过其潜在的用处。然而,与此同时,已在规范记录结构中为该号预留了一个位置,并已准备增加或代之以由国家书目机构指定的规范控制号。