华盛顿大学图书馆的RDA/BIBFRAME概念证明实验

目前采用RDA为编目规则做关联数据的编辑器有RIMMF和BIBFRAME Editor(BFE),分别是RDA和美国国会图书馆(LC)的官方推荐编辑器。华盛顿大学(UW)图书馆最近做了一个实验性的RDA输入表单,尝试与前两者有所不同的页面布局:
RDA Input Form
从截屏及说明看,有两个特点:
一是卡片式耳标(tab)选择编辑层次,共6个,分别是内容表达、载体表现、单件及相应的关系说明语。默认文献格式为印刷专著。
二是不同耳标的下部有书目格式单选钮(图书、连续性资源、计算机文档、地图、混乱资料、乐谱、录音、视频资料),提供相应的附加RDA元素。
相比BFE:先选择文献格式(专著、乐谱、连续出版物、地图、蓝光DVD、音频CD),每种格式有实例、作品和实例+作品三个选项。不只是选择先后不同:BEF只限PCC核心元素,UW输入表单包含其他RDA元素。

这个实验被称为proof-of-concept experiment,除了编辑界面,还做了以下几方面的探索:
1、根据RDA录入,以多种RDF方式输出。目前为RDA/RDF和BIBFRAME。
BFE录入界面是RDA,但背后是BIBFRAME到RDA映射,保存格式为BIBFRAME。
UW录入界面是RDA,按接近RDA/RDF的XML保存,最终生成完全的RDA/RDF格式记录,再通过RDA到BIBFRAME映射,自动变换生成BIBFRAME格式记录。
2、网络级编目:记录不保存在本地,而是在远程数据库(WorldCat作品)
3、馆藏信息:扩展OPAC显示需要的馆藏信息、衍生自MARC馆藏格式,用于流通 。RDA完全没有与馆藏相关的元素,BIBFRAME有部分。

本实验的主要结论是:使用与最详细输出尽可能相同粒度的中介格式(本例为RDA),完全可以由一种输入表单,通过自动转换方式输出多种格式。

Joseph Kiegel在BIBFRAME邮件组中介绍此实验后如是说:
“对未来生产编目系统的意义是:输入和输出不必直接相互绑定。相反,编目系统应该足够灵活以多种编码规范输出,可以自动方式达到。这将在不同受众所需粒度层次上方便数据交换。”
“在关联数据世界中,技术环境基本上不同。在MARC中,编目数据直接在承载物上编码,实际上,编目员工作的一部分是编码编目。而且,只有一种承载物。使用关联数据,有多个选项:编目和承载物可以并且应该分离。编目员应该专注于编目数据的创作,不需要用一个规范编码,编码可以在后台自动做。而且,可简单使用多种编码规范,并且应当如此。”【承载物Carrier,指编目格式,如MARC或者BIBFRAME】
via [BIBFRAME] Cataloging in multiple schemas / Joseph Kiegel (8 Feb 2016)

参见:
RIMMF:多元数据格式中的RDA(2014-8-20)
BIBFRAME+RDA全新亮相:bfe 0.2.0发布(2015-11-7)

会议与事件:MARC更新及BIBFRAME讨论

2011年11月美国国会图书馆(LC)宣布书目框架计划总体规划、准备放弃MARC,但其中有一条“继续维护MARC直至不再需要”,因此MARC更新工作仍在持续进行,自2012年起修改频率增加、由原来每年更新一次变为两次(MARC Format Overview)。2016年初的ALA仲冬会议期间,MARC咨询委员会(MAC)会场会期2天,有16个修订讨论稿、2个建议稿,真可谓内容丰富。
讨论稿2016-DP09《MARC21规范和书目格式中编码命名事件 》(Coding Named Events in the MARC 21 Authority and Bibliographic Formats) ,因涉及“事件”,在BIBFRAME论坛针对BF2.0“事件”建议的讨论中被提及,便仔细看了。
所谓“命名事件”即有名称的事件。在本讨论稿中并没有给出“事件”定义,只是列举了各种类型,除会议外,还有:战争、战役、地震、飓风、火山爆发、金融危机、饥荒、骚乱、罢工等。目前作为主题时,所有命名事件都放在611字段,但实际上611字段名称与定义均只包括“会议”。
本讨论稿由OCLC提出,因为OCLC在处理分面主题时(FAST),面对611字段“会议”中有这么多其他事件,觉得会令编目员产生疑问。同时会议本身也有很多品种,根据MARC21书目格式附录E(Appendix E – Alphabetical List of Ambiguous Headings,OCLC总结出包括:比赛、竞赛、探险、体育活动、运动会、节日、游行、展览、展销等。而附录E中“Events(事件)”标明使用650(论题)或X11(会议),这使得OCLC难以决定直接使用611字段。
事情虽然由主题而起,但对应的X11字段也有同样问题。因此OCLC提出此讨论稿,给出两个选项,一是继续使用X11字段,但修改定义(及字段指示符);一是改用X47字段(仿照648字段时间术语,可再细化出时间、地点子字段)。据说MAC会上有一个非正式投票,结果是赞同使用X47字段,此问题将在6月ALA年会上作为一个建议提出。如此,“会议”与其他“事件”分道扬镳了?(注:MARC修订顺序是,讨论稿->建议->批准)

——— 会议是施事者(agent) 还是事件(event)?———
对会议录等以会议(名称)作为责任者(施事者)的做法一直很困惑,尤其是奥运会、世博会之类非学术会议。从BIBFRAME邮件组对“事件”建议的讨论中,发现英美编目员也并不都认为“会议”作为创作者是常识;Thomas Berger说:甚至馆员在遵循展览目录由事件[展览]作为施事者“著”的假想时也很费事,*因为*它据称表达参加展览大众的“集体思想”——在英美有这种想法,确实不可思议。
原来,这是卡片目录时代需要一个“主要款目”所引起的限制。要查会议录,用户确实比较容易想到用会议名称检索,但这并不意味着用户认为会议本身是责任者,查会议名称要想到检索途径是“作者”当真不容易。当然这首先是编目条例的问题,而不是MARC格式问题。
然而,BIBFRAME虽声称“适应不同内容模型和编目规则”,LC却同时认为:“BIBFRAME不需要有一个地方放在现有规则下创建的111吗?”(Nate Trail)可见编目规则实际上是无法摆脱的。在BIBFRAME的“事件”讨论中,不少人认为会议并非“施事者”,而是有“施事者”参与的“事件”,LC的回应是:会议可以是事件,必须是施事者的子类(Ray Denenberg)。换言之,会议是不是“事件”还没定,但一定得是“施事者”。这难道不是很违反书目世界之外的常识的吗?
我理解原因或许是在建议中“事件”通常是作为主题,而会议录中会议并非主题。然而,建议中“事件”也可以是内容,如例2为音乐作品的演出录音,其本身为“事件”而非主题。总之,从BIBFRAME邮件组的讨论也可以明白,对于“事件”这个书目世界的闯入者,共识还远未达成

参见:BIBFRAME词表2.0草案发布(2015-11-4)
讨论参见BIBFRAME Archives, January 2016: 8. Events proposal for BIBFRAME 2.0

“德里达图书馆”关联数据计划

普林斯顿大学图书馆在ALA 2016仲冬会议的BIBFRAME更新论坛(BIBFRAME Update Forum at ALA Midwinter Meeting 2016)上,介绍了该馆将进行的德里达特藏关联数据计划。PPT备注页有详细解释,因而可以较全面了解:
De-“framing” Derrida: BIBFRAME, inscriptions, and library of Jacques Derrida / Jennifer Baxmeyer

对我来说,印象特别深刻的是他们对特藏揭示的全方位设计。比如图书“折角”也当作一种需要记录的标记;更意想不到的是,使用档案系统,记录每本书在原藏地(德里达家中)的相对位置,可了解哪本书边上放的是哪本书(如果接收图书时没有深思熟虑,随便扎捆打包,就无法复原当时的场景了)。
基本印象:对该特藏的完整揭示更接近“数字人文”而非“书目描述”范畴(首期作者题词部分尚可视为单件层书目描述)。

背景:
普林斯顿大学2015年3月完整购入著名哲学家德里达(1930-2004)个人图书馆计1.6万件藏书及其他单件,是为“德里达图书馆”。
在这些书上,有德里达阅读时留下的大量标记/注释(折角、划重点线、页边标记、报时贴、夹其他文字材料)。这些书有相当部分为原作者在书上题词后送给德里达的(超过6300册),对这些书中提及自己的部分,德里达基本上都作有标记。
所有这些信息(包括相邻放置图书信息),对研究德里达的学者都会是感兴趣的内容。比如目前已统计出题词图书的作者(其中超过10册的有12位),可显示其专业及社交网络。
目前的MARC记录很难确切揭示上述信息;档案标准EAD和EAC-CPF稍好,可以记录更多属性,但不具有链接、跳转功能。也就是说,即使信息都记录下来了,也只是文字(字符串),而没有包含标识符。

计划概述:
希望扩展BIBFRAME的单件层描述,采用并扩展W3C的Web注释以包括珍本书特征,揭示所有标记/注释及题词信息,最终生成机器可操作格式的数据,提供给学者做研究。
分担工作:评估BF及与德里达收藏相关的词表,识别需扩展和修订的领域,尤其在:
— 手稿注释/题词的语义
— 原始和转录注释/题词的关系
交付产品
— 德里达特藏中包含作者题词的单件子集的BF资源描述(期望2018年3月完成)【更艰巨的标记/注释部分,是否将会通过众包解决?】
— 用于特藏资料的原始资源描述的BF扩展本体

——— 联想的分割线 ———
在图书馆馆藏日益趋同的当下,独一无二的特藏是最能体现专业与学术图书馆价值的部分。
在获得特藏以后如何提供利用,不同图书馆有相当大的差异。
国内最多的是秘藏,近年有通过影印出版方式提供利用。出版还可取得收益,多少可补偿获得时的付出,虽然先前的付出与后来的收益多半是完全不同的两条线。
美国不少图书馆的方式则是直接提供利用,近年有越来越多图书馆开放电子版网上利用,甚至如普林斯顿大学上述工作那样以深度揭示提供利用。拥有特藏本身就已表明图书馆的独特眼光,提供利用则体现图书馆的存在价值,深度揭示更展现图书馆的专业能力,由此而吸引更多的捐赠、资助等投入,从而进一步增强图书馆在业界的地位。
不同的环境,产生不同的结果。