BIBFRAME试验项目培训资料

2015年,LC对参与BIBFRAME试验项目(BIBFRAME Pilot)的编目员做培训,培训资料专页:BIBFRAME Training at the Library of Congress

按网页说法,试验始于2015年8月(项目2015年6月开始)。试验前由LC合作教学部(COIN, Cooperative and Instructional Programs Division)4位成员做培训。
培训共3个模块,分别是:1语义网和关联数据导论,2BIBFRAME工具导论,3使用BIBFRAME编辑器进行书目描述。不过三个模块的PPT均为语义网和关联数据基础。模块1和2共有三个测试(Quiz),可以测测自己对语义网和关联数据基本知识的掌握程度。另有两个作业,分别是阅读资料和观看视频,可视为最基本参考文献:

作业1
– 阅读W3C“语义网使用案例和案例研究”中Europeana的案例
Case Study: Enriching and sharing cultural heritage data in Europeana (2012年6月) (2.5页)
解释Europeana为什么要对其数据采用语义网模型(EDM)
– 观看视频(来自YouTube和Vimeo,均需翻墙)
a. Linked Open Data – What is it? (3:42 minutes)
europeana介绍关联开放数据(LOD),非常形象化,通俗易懂
b. About Linked Jazz (6:37 minutes)
介绍爵士乐关联数据项目Linked Jazz,把访谈中涉及的人物做关联数据标识,采用DBPedia和VIAF、LC规范档URI。
【初以为图书馆的规范档主要是图书作者,对于非作者,恐怕只有极少数被当作图书研究对象(如传记)的人物才会收录。再细想,图书馆收藏很多非书资料,音像资料中会有很丰富的创作者信息,爵士乐相关人物可以用LC规范档也就不奇怪了】

作业2
– 阅读“RDF 1.1入门(RDF 1.1 Primer)”片断:1 导论;3.4 空节点(2.5页)
– 阅读“BIBFRAME: Why? What? Who?”(9页)
– 看视频:BIBFRAME: Update & Practical Applications (2014/09/04) (100 minutes)

———-LC BIBFRAME Pilot工作流程———
与BIBFRAME测试直接相关的是模块3第2单元的PDF文件,介绍BIBFRAME编辑器的使用。网上发布的为供不参加测试项目者用版本。

Module 3: The BIBFRAME Editor and the LC Pilot
Unit 2: The BIBFRAME Editor
This version intended for persons external to the Library of Congress BIBFRAME Pilot
Prepared by Tim Carlton and Paul Frank, Cooperative and Instructional Programs Division, Library of Congress
September 2015

其中第4单元工作流程,可了解试验的具体方法:
– 参与者对同一资源分别使用MARC和BIBFRAME创建书目描述。
首先在图书馆自动化系统中,用MARC按常规编制记录,另需在985字段“记录历史”中标记为测试记录,形如:985 ##$cBibFramePilot$e20150820
随后用BIBFRAME编辑器,查询先前在ILS中编制完成的记录,再选择相应模板(Profile)做编辑:
— 如果查到“BIBFRAME作品”描述,则选择“BIBFRAME实例”模板
— 如果没查到“BIBFRAME作品”描述,则选择“BIBFRAME作品、实例”模板
— 完成后保存,描述会转换为XML,导出到MARKLogic数据库,再导回BIBFRAME数据库。

注:采用LC联机目录的“专家搜索”查哪些记录参加了BIBFRAME测试,共1453条(远多于提供打包下载的891条BIBFRAME试验记录,参见:Library of Congress BIBFRAME Pilot update, 31 Mar 2016)。
大致看一下,记录中包括不少电子资源(报刊,非计算机程序),多按连续出版物做(头标s),也有一条按集成资源做(头标i:Atlanta studies),没看出差别。另外,发现访问链接都没有用856字段,而是用859字段,为什么?

UKMARC是MARC格式设计的三种范本之一(附ISDS格式)

今天接到国图H老师电话,问:通常都说MARC格式有两大类别,即USMARC或MARC21和UNIMARC,为什么你在文章中说“USMARC、UKMARC以及UNIMARC是MARC格式设计的三种范本”。H老师认为,UKMARC与MARC21相似,比如都用245字段表示题名与责任者,和UNIMARC用200字段差别则很大。她又以ISSN所用ISDS格式为例,认为也是差不多的,尽管不用245字段,但222和210字段是一样的。总而言之,她的想法是,小差别算不得一个独立类别。

电话中提及的文章是2010年Nalsi和我写的MARC四十年的发展及其未来。 如文中所说,UKMARC当年和USMARC一同推出(1969年),和USMARC一样,成为不少国家制订本国MARC格式的基础。只不过从1990年代开始,越来越多的国家由于种种原因,转向USMARC及后来的MARC21。最终英国也在2002年放弃UKMARC,因此现在就只有两大类别了。
在MARC21标准维护机构LC及MARBI所写《MARC21格式:背景和原理》The MARC 21 Formats: Background and Principles. Revised Nov. 1996)一文中,特别提到MARC21格式“试图保留与其他国家与国际格式如UKMARC和UNIMARC的兼容性”,也显示了MARC21与UKMARC、UNIMARC的鼎足之势。

不过,对于UKMARC与MARC21到底有什么根本差别,以至不同国家会各自选择作为建立本国MARC格式的基础,确实没有深究过。以前看过UKMARC记录,印象中只是链接字段用得比较多,其他确实感觉和MARC21差不多。
在不列颠图书馆(BL)网站上找到存档的《UKMARC手册》网站,包括格式及转换到MARC21的大部分资料,可惜未包含那个最直观的“UKMARC/MARC 21 mapping (conversion tables)”。
大致看了一圈,结论是:UKMARC是USMARC走向UNIMARC的中间体。以题名与责任者字段为例,虽然字段名和USMARC一样用245,但子字段不是没有确切定义的$a$b$c,而是针对相同作者、不同作者合订定义有多个子字段,更接近UNIMARC的200子字段。

由于子字段有确切定义,UKMARC可以和UNIMARC一样,著录时无需编目员录入ISBD标识符,由计算机自动生成。当年英国编目员改用MARC21想必很痛苦。德国当初改用MARC21就不采用ISBD标识符,此次实施RDA,仍坚持不采用,为此MARC头标第18位编目标准还另外定义了一个c作为区分。

UNIMARC的设计初衷,是作为不同MARC格式之间的交换格式。当初各国MARC分别基于USMARC和UKMARC,因而可以认为,最重要的就是这两个范本之间的交换。作为交换格式,竟然把原来的字段名完全改掉,大概是出于别看着太相似的考虑吧?
想到MARC21为RDA新增了很多字段、子字段,而看上去比USMARC定义更精准的UKMARC却在那之前消失了,真令人感叹。因为LC更强势,因为美国的图书馆自动化系统更普及。BL本身放弃UKMARC,主要为降低标准维护成本、方便数据交换,另一方面也是因为要更换系统。

———UKMARC手册(UKMARC Manual ———
UKMARC最初为英国国家书目设计,即生成BNBMARC记录(The UKMARC Manual — Preface) 。BL在2004年采用MARC21(The UKMARC Manual),自2002年开始推广。UKMARC最后更新在2002年11月(Moving to MARC21)。

两种MARC的字段、子字段、字段指示符不及一一对照,差别不少是可以肯定的。
比如形式上,UKMARC字段指示符不用#(空位,未定义),未定义的情况下通常用0

其他比较重要的差别如下(来自:Structure of the UKMARC format):
– 不同的9XX字段块:900-945 参照,946-999本地字段
– USMARC中没有的Level:1位数字,在字段指示符后加冒号,如700.10:1,表示分析。但BNBMARC记录中未用,而是用700-745附加款目,用248字段创建分析层。

(来自:Changing the record,PPT及配套注释)
(PPT slide 17)字符集:British Library Exchange Character Set (BLECS)(MARC21支持:MARC-8,UCS/Unicode)
(PPT slide 45)In分析:002字段,MARC21不支持。MARC21采用链接字段:774构成单元款目/773组成部分
(PPT slide 46)题名:240.3=MARC21 130,745=MARC21 246/247
(PPT slide 47)多部分:248字段,MARC21无,影响到丛编、内容附注。BL的做法是映射到MARC21 245$n/$p。

———ISDS的分割线———
ISDS(International Serials Data System) ,学生时代应该是接触过的。只是那时还不懂MARC,因而从来不曾想到ISDS也是一种MARC格式。今天在UNESCO网站上下了一个1973年的古董版:UNISIST Guidelines for ISDS。有空学习下。

BIBCO标准记录(BSR)及解读

依据一定标准简化编目,是从上世纪末就开始的国际编目趋势。近日为查有关“核心记录”的资料,翻出自己当年在《中国图书馆学报》上发表的“书目记录等级与核心记录标准的发展”。如果自恋的话,可以说这篇十多年前写的文章至今仍有现实意义——也可以完全反过来说,当年写这篇文章是希望推动依据标准而非随意地简化编目,其实并没有起到什么作用。

按原文中参考文献找出PCC的核心记录标准(BIBCO Core Record Standards),发现早在2010年,BIBCO就已经不再使用《核心记录标准》,代之以《BIBCO标准记录》(BSR),以元数据应用纲要(MAP)之名发布。基本介绍翻译如下:

BIBCO Standard Record Metadata Application Profiles (MAPS)
– BIBCO标准记录(BSR)是一个书目单行记录“模型”,在共享数据库环境中使用单一编码等级。编目员在创建、修改书目记录时,满足BSR需求,确定最适合其馆藏资源以及其用户需求的完全级别
– BSR是一个最低要求记录(floor record),强调检索点甚于广泛而冗余的描述数据。元数据应用纲要(MAPs)向编目员提供一套适合书目格式的必备元素及有则必备元素。这些元素确定用于支持用户查找、识别、选择和获取资源的需求。BSR中,规范记录必须支持受控检索点。
– MAP中的元素附有使用值,某些情况下规定子字段或其他基本点。机构可能不需要对每种资料类型使用BSR,所有资料类型BSR共有这些特征(附特征PDF文件)。
基于RDA的BIBCO标准记录元数据应用纲要
包括适用于档案资料、录音、地图资源、电子资源(如以计算机文档格式编目)、图片资料、动态图像、乐谱、珍本资料和文本专著。基于RDA元素编排。【当前版2015年4月14日,去年6月下载的是2014-4-15更新,估计每年依RDA年度更新修改】
基于AACR2的BIBCO标准记录元数据应用纲要
多个AACR2 BSR MAP,适用于不同资料类型。按MARC字段顺序排列

——— 解读 ———
根据以上介绍、BSR特征文件(Characteristics of BIBCO Standard Records (BSR)),及简单对照,得到以下几点:
1、BSR强调检索点(规范检索点),减少冗余描述(比如单为提供检索点而做的附注)。同时给予编目员依据待编资源自行判断的权利,可以在BSR元素集基础上、依据本地编目实践增加相应元素——这也是与RDA原则一致的。
2、BSR针对单行记录。这里的单行(monographic)不是指图书或专著,而是指非连续性资源,还适用于图书之外所有其他类型资料即档案资料、录音、地图资源、电子资源、图片资料、动态图像、乐谱和珍本资料。
3、BSR元素集的确定,理论上依据FRBR用户任务(查找、识别、选择和获取),操作上选择AACR2必备(M)和有则必备(A)元素,或者RDA核心和“如果核心”,并附加PCC的“BSR核心”元素。PCC核心元素的确定,实际上多少也是依据AACR2的。
4、符合BSR的即为“完全级记录”,头标第17位编码等级采用代码“空格”。原来的核心级代码=4,仍为有效代码,只是自2010年起不再使用。
5、由BSR元素集范围可知,符合BSR的“完全级”更接近原来的“核心级”。简单对照PCC“图书”核心记录标准和LC国家级完全记录需求(National Level Full and Minimal Requirements),代码字段至少没有041语种、043地理区域,也没有描述学术著作常用的500/504书目&索引附注。BSR有041字段,但没有043、500/504书目和索引——就此来说,PCC完全级记录标准显然是下降的(标识为042$apcc)。
6、由于RDA变化频繁(但相对较少涉及核心元素),稳定的BSR元素集宜参考基于AACR2的BSR MAP。同时该MAP以MARC字段顺序排列,也更适合编目查用。