MARC之后的三个方案及其优缺点

ALA技术源前些天也刚举办了一个关联数据研讨班,Karen Coyle主讲:
Libraries and Linked Data: Looking to the Future
图书馆与关联数据:展望未来

PPT共3个,已由ALA TechSource发到slideshare(可恶的是slideshare近日竟然也被墙):

1. One short intro to linked data
关联数据简介
2. After MARC: Options, New bibliographic framework
MARC之后的选项,新书目框架
3. Tools for LLD: vocabularies, linking, and application programming
图书馆关联数据工具:取值词表、链接及应用

———-MARC之后的选项———-
这部分是重点,总结MARC之后的三个方案,并分析各自的优缺点。
由RDA的三个实施方案(scenarios,p.4-7,扁平无链接、书目和规范链接、关系/面向对象),引入Karen的新书目框架三个方案(序列化、抽取、原生,p.8)。

方案3、序列化(Serialize, p.9-21):直接把MARC转为RDF格式
优点:机械的;不改变数据;无需改变系统
缺点:不改变数据;图书馆数据留在图书馆孤岛中;不链接到图书馆外部数据

方案2、抽取(Extract, p.22-37):从MARC记录库中抽取数据
举已发布为关联数据的三个例子:不列颠图书馆(BL,p.25-29),西班牙国家图书馆(BNE,p.30-35),OCLC(p.36)。
优点:无需改变图书馆系统;可在了解更多后重复抽取;编目员不可见
缺点:编目员不可见,因此没有人工质量控制(QC);关键标识不是基元数据的一部分;受当前记录内容限制
[不知道为什么我的Chrome浏览器在BNE网站看不到可视化展示]

方案1、原生(go native, p.38-39)
(1)things,元素和值都有URI
(2)存储things和关系的数据设计
(3)创建界面对创建者隐藏这些,但保持数据完整
优点:与Web资源互操作;与RDA的目的互通;图书馆目录有更丰富的可能,用户无需在图书馆和Web间选择信息源
缺点:需要替换图书馆系统;难于论证成本/效益
[目前LC的书目框架转换行动显然属于方案1──参见:LC正式启动以关联数据取代MARC (2012年5月26日)]

———-Links for Linked Data———-
PPT中涉及的链接,在Karen自己的网站上分门别类列出,很好的参考源。包括:
关联数据──概述
书目元数据元素(非图书馆)
其他元数据元素
图书馆关联数据
·图书馆标准数据集 Library Standard Data Elements
RDA Vocabularies and Elements
FRBR (FRBRer)
ISBD
FRAD
MADS in RDF
[很抱歉自己在上图关联数据会议上遗漏了最后那个──幸亏unconference时远洋师在回答国图MM关于发布规范档的关联数据问题时,做了推荐]
·取值词表
·图书馆和其他书目数据集
·开放元数据注册 Open Metadata Registry
软件和工具
关联数据组织与活动
关联数据实例
·数据库(开放图书馆、Freebase)
·样本数据(DCMI/RDA工作组的RDA使用案例:Cataloger Scenarios)[update 2015-8-26链接改为:http://wiki.dublincore.org/index.php/Cataloger_Scenarios,已没有龟标及RDF/XML格式的RDF表达]
提供10种场景,帮助编目员了解如何使用RDA取值词表、处理FRBR关系。链接到场景元数据的RDF表达,有龟标格式和RDF/XML格式。
·开放图书馆 Open Library
·开放研究在线 Open Research Online
·虚拟国际规范档 VIAF
·DBPedia
·Freebase
推荐阅读

[update 2012-7-24] Karen本人的博文
Coyle’s InFormation: Futures and Options(有墙)

Diane Hillmann谈书目框架转换行动

Diane Hillmann在我看来是一位理想主义的行动家。看到她和Jon Phipps的博文,谈LC的书目框架转换行动,涉及理想中的元数据世界未来。尽管他们的设想未必成为现实,但可解不少困惑,于是全文翻译。[少许地方仍然以方括号加感想,粗体也为本人所加]
Jon Phipps, Diane Hillmann, and Stuart Sutton
OMG项目团队成员,从左到右:Jon Phipps, Diane Hillmann, and Stuart Sutton

———-如果我们被问到———-
Metadata Matters: If We Were Asked (2012-7-4)

如果被问到(有时正是这样)我们对书目框架转换行动结果的看法,我们的回答会强调其技术和社会方面。

首先,鉴于若干不同场所的技术发展,考虑我们现在可以做的是把关联开放数据引入我们相对封闭的世界。一些具体建议:能够共享元数据,不仅是以单一共同“取值词表”表达的,而且是采用多种不同取值词表、以RDF、OWL/RDFS、RDFa、微数据及其他工具表达与发布的;[ONIX是采用兼容不同取值词表的很好例子];有指定使用这些“语义”砖块(DC应用纲要,以及W3C和DCMI的新兴溯源provenance规范)的方法,让机器使用、处理和发布数据,不需要中央启用节点;具有在现有与预期元数据方案间映射的技术与策略,彻底催毁社区之界的樊篱。

这是图书馆相关元数据的后MARC世界,原生于我们元数据的格式不再是其最重要的特征;无需做有损映射,去转换数据服务于不同需求;共享鲜有(最终没有)障碍。MARC所代表的巨大的价值──数十年来为回应大量使用案例而建立的语义(均完整存档于MARBI网站)──在我们移向一个不同领域时仍然极其重要。然而MARC语法产生自20世纪中期的需求,维持它所需的紧密共识模型,不再适用于当前及未来全球图书馆界的需求。[各做各的?]

这里适用一般的解释:有些技术并未完全到达黄金时期,然而在我们所生活的世界中,“完成的”更有可能指某些死去的,而非标准或工具开发的目标。我们个人非常熟悉的领域(无可惊讶)是词表管理和映射的补充领域。第一个是上线并运行为开放元数据注册(OMR)(尽管“持续的改进”引擎太过厌烦);第二个,映射是我们非常感兴趣的,已产生文章、论文及演讲(文后选择了部分),当然还有太多的博文(包括本文)和讨论组帖子。
我们相信,OMR及开发中的映射能力合在一起,能让遗产数据高效、损失最小地转向开放关联数据世界,并在处理中强化可得到的有用数据选项。*

在技术闪光中通常被忽视的是,有可能重新整合以往由于技术局限(及其他原因)而被撕裂的社区。在我们共同的过去,图书馆界创建数据时,基于一致使用AACR2和MARC的平台共享约定。某些图书馆社区──最突出的是法律和音乐──愿意妥协于更大图书馆社区内。其他如艺术图书馆和博物馆界及档案馆,则打破图书馆共识,另行开发更好地满足其需求的数据标准[曾经ISBD中是有档案的]。然而这些专业化标准,已在巨大的MARC谷仓之外,导致更多的谷仓。

如果意图是“取代MARC”(在某种程度上),那就是重置(re-placing)MARC及其内在局限,由我们世界的中心回到芸芸众生中的一员。转换的价值还在于扩展的能力,由半世纪前MARC形成的数据共享环境,到包括博物馆、出版社和档案馆在内的更广泛的感兴趣社区。满足消解这些谷仓、使我们的数据易于理解并以宿主方式重用的目标,将有助于开启我们已致力多年的“数据网”。Eric Miller [LC选择的MARC终结者]在Anaheim[ALA年会]书目框架更新会上解释得相当好:通过移到关联数据世界,我们实际上从定义上超出了图书馆/档案馆/博物馆(LAM)世界──走出去是一个相当大的世界。然而,与LAM界整体协作达到那儿,我们获益良多,……。仅仅把我们的视野局限在一个“MARC关联数据模型”可能是一个重要的起点,但低于我们的愿景需要延伸之所在

事实是,MARC在很长时间里不会离开,如果不是永远的话。图书馆如何转换有很多变数,取决于机构支持、短期和长期需求,以及现有的合作关系。由MARC转向关联数据世界的过程已经开始。RDA及其RDF词表是一个开端,如同MARC的完整RDF版(http://marc21rdf.info/)[也是OMR的成果]。多年来的ALA会前会、演讲及讨论已为这些改变准备了土壤。但是我们需要一个计划,采取某些实际步骤──这个步骤包括那些在战壕里工作却没有得到很大支持、而仍义无反顾前行的小组。书目框架转换行动不只是作为技术专家们的操场,因为在大多数情况下,并非技术制约着我们──是机构的惯性,以及难以找到使我们不相互对立的办法。我们需要的计划要平衡技术与社会、快速见效与长远势头、速度要求与费时且需构建支持的公开讨论

在我们看来,我们具有的是一个机会,去逆转长期以来元数据界的割据趋势,创造明显具有相似的挑战与利益的三个社区[LAM]间较少樊篱、更多数据交换的未来。我们认为,利用已极大改变的技术环境做这件事的时间已经到来。

* “哦,你只不过在此吹响自己的号角”──如此回应本博文很容易,也确实如此。但我们这么做是因为相信这很重要,而不仅仅是因为我们在做而相信其重要。我们相信我们已做和将做工作的价值,作为书目框架转换行动讨论的一部分,我们看到了很大的相关性。

LC正式启动以关联数据取代MARC

5月22日,美国国会图书馆(LC)宣布其“书目框架转变行动”启动建立模型工作,远洋师在书社会中及时通报。因为当时自己正好在做一件事不想中断,就没有跟进这个消息。昨天把积了几天的RSS订阅过了一遍,发现很奇怪的一个现象,尽管消息在ILFA-L和RDA邮件组中都发了,但国外博客中极少提及(甚至编目相关信息最多的catalogablog都没有),而对此事的评论也未见。书社会中雨师最早发博文,其评论担心新模型会变成另一种MARC。

下面是LC新闻稿的翻译:
The Library of Congress Announces Modeling Initiative (May 22, 2012)

LC很高兴地宣布,已经与Zepheira签约,帮助加速“书目框架行动”的启动。项目的主要工作是把MARC21格式翻译到关联数据模型,同时尽可能保留传统格式健壮且有利的方面。Zepheira给项目带来图书馆应用关联数据技术的广泛经验。
Zepheira团队由Eric Miller领导,他是早期W3C语义网行动的领导者,也曾在图书馆情报学界工作。公司在Miller先生领导下,活跃于“语义网和图书馆”标准的开发,以及支持关联数据技术与图书馆应用的开源工具方面。这些活动所体现的知识与经验,有助于构建核心数据模型,并支持作为新书目框架和相关服务基础的原型服务。
LC已要求Zepheira提出作为有力起点的模型供讨论,并对有助于本工作的、目前正进行的[其他]相关行动作出分析。LC期望,基于图书馆界有价值的反馈,以及所表达需求的自然进展,将改变或进一步调整提出的模型。最初的模型将作为演示系统/服务的工作基础,反过来也会用于进一步细化模型。期望这样的迭代反馈循环终将确保一个灵活的书目框架,一个健壮的参照规则,一个支持布署的基础架构,以及一个有效的升级计划,支持图书馆界从MARC转换到新框架。
LC现在将开始组织不同的方案,以使图书馆参与者更为广泛,并包括国际用户和合作者、不同类型信息机构和图书馆,以及图书馆供应商。我们将在书目框架转变行动网站(Bibliographic Framework Transition Initiative website)上随工作进展发布信息,特别是涉及重要事件时。
LC打算提出该行动的计划,在加州Anaheim的ALA年会上讨论并由图书馆界提供意见。Eirc Miller在这一更新时期将加入LC。(LC书目框架转换更新论坛,6月22日星期日,10:30 am-12:00,Anaheim Marriott Grand Salon A-C.)。

———-相关背景———-
关于Eric Miller其人:
The Digital Shift: Library of Congress Announces Modeling Initiative (May 24, 2012) By Matt Enis
LJ技术副主编、Matt Enis在The Digital Shift博客上介绍说,Eric Miller现任Zepheira公司总裁,曾是OCLC高级研究科学家、DCMI联合创始人(难怪上图那帮人跟他那么熟)。
Keven在书社会雨师日志下评论说Eric Miller是DC的发明人、RDF的起草人、W3C 语义小组的前负责人。

关于Zepheira公司:
Metadata Discussion Group: Library of Congress and Linked Data (May 23, 2012) by Jennifer Liss
印第安那大学图书馆的元数据讨论组博客介绍说,去年LC与Zepheira合作制作了Viewshare网站,为数字遗产馆藏提供一个平台,展示其时间线、标签云、交互地图有其他Web产品。
Viewshare网站以前远洋师好象也介绍过,也曾前往一观。

———关于LC的书目框架转换行动———-
准备抛弃MARC?美国国会图书馆启动“书目框架转变行动”(2011年5月24日)

国会图书馆书目框架计划总体规划 (2011年11月2日)

LC书目框架转换行动:首届更新论坛 (2012年2月7日)
即将在ALA年会上举办的应该是第二届吧

———相关评论———-
rainzen的书社会日志: 评国会图书馆的声明 (2012-05-23)

Nalsi的西文编目笔记III:【翻译】国会图书馆可能开始放弃MARC (五月 28th, 2011)
原文:Library of Congress May Begin Transitioning Away from MARC / Michael Kelley. LibraryJournal, May 26, 2011。作者提到“受到RDA的驱动”。

书蠹精:国际编目领域的重大新闻:美国国会图书馆可能放弃MARC格式 (2011-05-27)

“书目框架转变行动”引来一片赞扬 (2011年5月25日)