书目框架模型草案发布

期待已久的美国国会图书馆“书目框架转换行动”报告《书目框架作为数据网络:关联数据模型和支持服务》发布,介绍了将要取代MARC的新模型草案。nalsi第一时间在微博上发布消息,又发了介绍博文:美国国会图书馆“书目框架转换行动”的新报告:《书目框架作为数据网络》(2012-11-25)

Bibliographic Framework as a Web of Data: Linked Data Model and Supporting Services / Library of Congress. Washington, DC, November 21, 2012(pdf, 42页)

新模型被称为BIBFRAME(书目框架的简称),据称不仅用于取代MARC,也是未来网络化世界中书目描述的基础(p.3)[或者说,不仅用于图书馆界]。三个目标:
1、清晰区分概念内容及其物理表现(如,作品和实例)
2、专注于明白识别信息实体(如,规范)
3、平衡与揭示实体间关系

BIBFRAME模型由4个主要类(class)组成(p.8):
创作作品(Creative Work):反映编目单件概念实质的资源
实例(Instance):反映作品的个体资料体现的资源
规范(Authority):反映定义作品和实例中关系的关键规范概念的资源,如人、地点、论题、组织等。
注释(Annotation):以附加信息装饰其他BIBFRAME资源的资源。如馆藏信息、封面、评论等。
──显然,在这个模型中,没有了FRBR的“内容表达”。nalsi称“这是一个简化版的FRBR模型”,我的留言:“FRBR的内容表达确实比较难界定,索性取消掉,倒也简单。可以用其他分面(语种、媒介类型等)对作品及其显示进行细分。”
──对类的具体说明,显示其“草案”状态:
反映作品关系,举例为“整体/部分”关系(p.10):显然还有待充分扩展;
每个BIBFRAME实体为一个且仅一个BIBFRAME作品的实例(p.10):难道不存在合订的情况?

报告中说明BIBFRAME模型的图1和图2,在9月份的一个介绍PPT中曾出现过:
Bibliographic Framework Initiative: Approach for MARC Data as Linked Data / Sally McCallum, Library of Congress
[update 2012-11-27] PPT中已经介绍了4个核心类,作为阶段1(phase 1),早期实验(10-11月)作为阶段1.5,阶段2为细化模型。

作为一个解决方案,BIBFRAME将有自己的词表(BIBFRAME Vocabulary, p.15)和命名空间(http://loc.gov/bibframe/vocab)表示方式(Serializing, p.16),支持工具(p.21)。
BIBFRAME词表尚未发布。从BIBFRAME和RDA-L两个邮件组中就此报告的讨论可以想像,由于其与作为RDA基础的FRBR的差异,其词表必然与RDA有某种程度的差异,或许一场风暴难以避免。

参见相关博文:书目框架

[update 2012-12-1] 官方消息:News and Announcements (November 23, 2012)
Bibliographic Framework as a Web of Data: Linked Data Model and Supporting Services (November 21, 2012)

NISO得到梅隆基金资助,评估新书目框架现状及未来需求

LC的书目框架转换行动,原说9月会有可供讨论的初步报告面世,至今没有音讯。
一年前,美国国家信息标准委员会(NISO)常务理事Todd Carpenter就有NISO主导取代MARC新标准制订之意,如今LC行动迟迟没有结果,或许更是显示NISO作用的时候──上月NISO得到梅隆基金近5万美元资助,用于评估新书目框架现状及未来需求。NISO设想的也是关联数据。

消息发布在11月号的NISO Newsline上:
NISO Receives Mellon Foundation Grant to Assess the Current State and Future Needs of a New Bibliographic Framework
“NISO得到安德鲁·梅隆基金48516美元资助,研究确定图书馆、高等教育和非营利网络信息界的需求,确保在一个不断网络化、关联数据环境中,能够使用和交换书目数据。资金将用于在美国举办一个面对面会议和四个全球网络会议,以及网络会议期间的工作组活动。会议将协调包括图书馆、技术人员、图书馆系统供应者及其他国际标准开发组织在内的主要群体的需求。”
“本计划的目标是吸引关键的利益相关者──来自图书馆、系统供应者、高等教育/研究机构,以及非传统书目信息用户──就基于关联数据的新书目框架所需的活动,发展出社区线路图的共识,识别标准开发所需的交换点,记录应当做功能性测试的区域,以给所有关联数据书目交换的参与者提供反馈。”

Todd Carpenter在卷首语中做了长篇评论(一直觉得Carpenter的卷首语可媲美《数字图书馆论坛》张主编):
NISO and the Future of Bib Exchange
在回顾了书目交换的历史、现状及NISO的作用后,介绍本资助项目:
“为集合这些跨界社区,推进走向新书目信息交换方式,NISO向安德鲁·梅隆基金提出一个项目设想,帮助方便这一问题的跨机构协作。……上月批准实施这项工作。本计划目标是组织一个跨不同兴趣社区及批评机构的组织。拨款将支持一次现场会议及一系列网络会议,讨论帮助在共享目标及达成这些目标的道路上取得共识。项目最终结果是一个报告,关注必需的发展共识的领域,将提出应该做的功能性测试点,可以向所有关联书目数据交换的参与者提供反馈。
他的结语:
“这是整个书目交换转换中的一小步;我们社区更大的项目是野心勃勃的。NISO对这一发展的时间表、兴趣和复杂性及对每个受影响机构的潜在分歧很清醒。反思这一计划的重要性,我认为关键的是对目标、需求及尽可能多的受影响参与者的期望的买进──包括以前不曾参与图书馆数据的新参与者,如语义网开发者,可以关联图书馆数据到更大的Web环境。协调、协作和共识对成功的结果至关重要。幸运的是,这些正是NISO在行动中设置的立场。没有一个组织能够单独推进任何具体方案,不管其在社区中的地位如何。我们希望从一开始就取得尽可能多的一致,推进前进过程中可以继续协作的共同方向。” [既是说自己,也是说LC吧]
最后,发英雄贴:“随着项目落地,接下来二个月中,NISO将与社区接触。如果你的机构对参与感兴趣,请联系NISO办公室。未来数周我们将提供更多项目信息。”

via NISO Newsline, November 2012
参见:NISO有意主导取代MARC新标准制订?(2011年11月6日)

[update 2014-2-13] 最新进展:NISO报告:通过新交换环境绘制航线:NISO书目路标行动
Charting a Course through a New Exchange Environment: The Niso Bibliograpic Roadmap Initiative / Todd Carpenter
ISQ:Information Standards Quarterly (Winter 2013, Vol.25 issue 4) p.33-34

MARC之后的三个方案及其优缺点

ALA技术源前些天也刚举办了一个关联数据研讨班,Karen Coyle主讲:
Libraries and Linked Data: Looking to the Future
图书馆与关联数据:展望未来

PPT共3个,已由ALA TechSource发到slideshare(可恶的是slideshare近日竟然也被墙):

1. One short intro to linked data
关联数据简介
2. After MARC: Options, New bibliographic framework
MARC之后的选项,新书目框架
3. Tools for LLD: vocabularies, linking, and application programming
图书馆关联数据工具:取值词表、链接及应用

———-MARC之后的选项———-
这部分是重点,总结MARC之后的三个方案,并分析各自的优缺点。
由RDA的三个实施方案(scenarios,p.4-7,扁平无链接、书目和规范链接、关系/面向对象),引入Karen的新书目框架三个方案(序列化、抽取、原生,p.8)。

方案3、序列化(Serialize, p.9-21):直接把MARC转为RDF格式
优点:机械的;不改变数据;无需改变系统
缺点:不改变数据;图书馆数据留在图书馆孤岛中;不链接到图书馆外部数据

方案2、抽取(Extract, p.22-37):从MARC记录库中抽取数据
举已发布为关联数据的三个例子:不列颠图书馆(BL,p.25-29),西班牙国家图书馆(BNE,p.30-35),OCLC(p.36)。
优点:无需改变图书馆系统;可在了解更多后重复抽取;编目员不可见
缺点:编目员不可见,因此没有人工质量控制(QC);关键标识不是基元数据的一部分;受当前记录内容限制
[不知道为什么我的Chrome浏览器在BNE网站看不到可视化展示]

方案1、原生(go native, p.38-39)
(1)things,元素和值都有URI
(2)存储things和关系的数据设计
(3)创建界面对创建者隐藏这些,但保持数据完整
优点:与Web资源互操作;与RDA的目的互通;图书馆目录有更丰富的可能,用户无需在图书馆和Web间选择信息源
缺点:需要替换图书馆系统;难于论证成本/效益
[目前LC的书目框架转换行动显然属于方案1──参见:LC正式启动以关联数据取代MARC (2012年5月26日)]

———-Links for Linked Data———-
PPT中涉及的链接,在Karen自己的网站上分门别类列出,很好的参考源。包括:
关联数据──概述
书目元数据元素(非图书馆)
其他元数据元素
图书馆关联数据
·图书馆标准数据集 Library Standard Data Elements
RDA Vocabularies and Elements
FRBR (FRBRer)
ISBD
FRAD
MADS in RDF
[很抱歉自己在上图关联数据会议上遗漏了最后那个──幸亏unconference时远洋师在回答国图MM关于发布规范档的关联数据问题时,做了推荐]
·取值词表
·图书馆和其他书目数据集
·开放元数据注册 Open Metadata Registry
软件和工具
关联数据组织与活动
关联数据实例
·数据库(开放图书馆、Freebase)
·样本数据(DCMI/RDA工作组的RDA使用案例:Cataloger Scenarios)[update 2015-8-26链接改为:http://wiki.dublincore.org/index.php/Cataloger_Scenarios,已没有龟标及RDF/XML格式的RDF表达]
提供10种场景,帮助编目员了解如何使用RDA取值词表、处理FRBR关系。链接到场景元数据的RDF表达,有龟标格式和RDF/XML格式。
·开放图书馆 Open Library
·开放研究在线 Open Research Online
·虚拟国际规范档 VIAF
·DBPedia
·Freebase
推荐阅读

[update 2012-7-24] Karen本人的博文
Coyle’s InFormation: Futures and Options(有墙)