NISO得到梅隆基金资助,评估新书目框架现状及未来需求

LC的书目框架转换行动,原说9月会有可供讨论的初步报告面世,至今没有音讯。
一年前,美国国家信息标准委员会(NISO)常务理事Todd Carpenter就有NISO主导取代MARC新标准制订之意,如今LC行动迟迟没有结果,或许更是显示NISO作用的时候──上月NISO得到梅隆基金近5万美元资助,用于评估新书目框架现状及未来需求。NISO设想的也是关联数据。

消息发布在11月号的NISO Newsline上:
NISO Receives Mellon Foundation Grant to Assess the Current State and Future Needs of a New Bibliographic Framework
“NISO得到安德鲁·梅隆基金48516美元资助,研究确定图书馆、高等教育和非营利网络信息界的需求,确保在一个不断网络化、关联数据环境中,能够使用和交换书目数据。资金将用于在美国举办一个面对面会议和四个全球网络会议,以及网络会议期间的工作组活动。会议将协调包括图书馆、技术人员、图书馆系统供应者及其他国际标准开发组织在内的主要群体的需求。”
“本计划的目标是吸引关键的利益相关者──来自图书馆、系统供应者、高等教育/研究机构,以及非传统书目信息用户──就基于关联数据的新书目框架所需的活动,发展出社区线路图的共识,识别标准开发所需的交换点,记录应当做功能性测试的区域,以给所有关联数据书目交换的参与者提供反馈。”

Todd Carpenter在卷首语中做了长篇评论(一直觉得Carpenter的卷首语可媲美《数字图书馆论坛》张主编):
NISO and the Future of Bib Exchange
在回顾了书目交换的历史、现状及NISO的作用后,介绍本资助项目:
“为集合这些跨界社区,推进走向新书目信息交换方式,NISO向安德鲁·梅隆基金提出一个项目设想,帮助方便这一问题的跨机构协作。……上月批准实施这项工作。本计划目标是组织一个跨不同兴趣社区及批评机构的组织。拨款将支持一次现场会议及一系列网络会议,讨论帮助在共享目标及达成这些目标的道路上取得共识。项目最终结果是一个报告,关注必需的发展共识的领域,将提出应该做的功能性测试点,可以向所有关联书目数据交换的参与者提供反馈。
他的结语:
“这是整个书目交换转换中的一小步;我们社区更大的项目是野心勃勃的。NISO对这一发展的时间表、兴趣和复杂性及对每个受影响机构的潜在分歧很清醒。反思这一计划的重要性,我认为关键的是对目标、需求及尽可能多的受影响参与者的期望的买进──包括以前不曾参与图书馆数据的新参与者,如语义网开发者,可以关联图书馆数据到更大的Web环境。协调、协作和共识对成功的结果至关重要。幸运的是,这些正是NISO在行动中设置的立场。没有一个组织能够单独推进任何具体方案,不管其在社区中的地位如何。我们希望从一开始就取得尽可能多的一致,推进前进过程中可以继续协作的共同方向。” [既是说自己,也是说LC吧]
最后,发英雄贴:“随着项目落地,接下来二个月中,NISO将与社区接触。如果你的机构对参与感兴趣,请联系NISO办公室。未来数周我们将提供更多项目信息。”

via NISO Newsline, November 2012
参见:NISO有意主导取代MARC新标准制订?(2011年11月6日)

[update 2014-2-13] 最新进展:NISO报告:通过新交换环境绘制航线:NISO书目路标行动
Charting a Course through a New Exchange Environment: The Niso Bibliograpic Roadmap Initiative / Todd Carpenter
ISQ:Information Standards Quarterly (Winter 2013, Vol.25 issue 4) p.33-34

MARC之后的三个方案及其优缺点

ALA技术源前些天也刚举办了一个关联数据研讨班,Karen Coyle主讲:
Libraries and Linked Data: Looking to the Future
图书馆与关联数据:展望未来

PPT共3个,已由ALA TechSource发到slideshare(可恶的是slideshare近日竟然也被墙):

1. One short intro to linked data
关联数据简介
2. After MARC: Options, New bibliographic framework
MARC之后的选项,新书目框架
3. Tools for LLD: vocabularies, linking, and application programming
图书馆关联数据工具:取值词表、链接及应用

———-MARC之后的选项———-
这部分是重点,总结MARC之后的三个方案,并分析各自的优缺点。
由RDA的三个实施方案(scenarios,p.4-7,扁平无链接、书目和规范链接、关系/面向对象),引入Karen的新书目框架三个方案(序列化、抽取、原生,p.8)。

方案3、序列化(Serialize, p.9-21):直接把MARC转为RDF格式
优点:机械的;不改变数据;无需改变系统
缺点:不改变数据;图书馆数据留在图书馆孤岛中;不链接到图书馆外部数据

方案2、抽取(Extract, p.22-37):从MARC记录库中抽取数据
举已发布为关联数据的三个例子:不列颠图书馆(BL,p.25-29),西班牙国家图书馆(BNE,p.30-35),OCLC(p.36)。
优点:无需改变图书馆系统;可在了解更多后重复抽取;编目员不可见
缺点:编目员不可见,因此没有人工质量控制(QC);关键标识不是基元数据的一部分;受当前记录内容限制
[不知道为什么我的Chrome浏览器在BNE网站看不到可视化展示]

方案1、原生(go native, p.38-39)
(1)things,元素和值都有URI
(2)存储things和关系的数据设计
(3)创建界面对创建者隐藏这些,但保持数据完整
优点:与Web资源互操作;与RDA的目的互通;图书馆目录有更丰富的可能,用户无需在图书馆和Web间选择信息源
缺点:需要替换图书馆系统;难于论证成本/效益
[目前LC的书目框架转换行动显然属于方案1──参见:LC正式启动以关联数据取代MARC (2012年5月26日)]

———-Links for Linked Data———-
PPT中涉及的链接,在Karen自己的网站上分门别类列出,很好的参考源。包括:
关联数据──概述
书目元数据元素(非图书馆)
其他元数据元素
图书馆关联数据
·图书馆标准数据集 Library Standard Data Elements
RDA Vocabularies and Elements
FRBR (FRBRer)
ISBD
FRAD
MADS in RDF
[很抱歉自己在上图关联数据会议上遗漏了最后那个──幸亏unconference时远洋师在回答国图MM关于发布规范档的关联数据问题时,做了推荐]
·取值词表
·图书馆和其他书目数据集
·开放元数据注册 Open Metadata Registry
软件和工具
关联数据组织与活动
关联数据实例
·数据库(开放图书馆、Freebase)
·样本数据(DCMI/RDA工作组的RDA使用案例:Cataloger Scenarios)[update 2015-8-26链接改为:http://wiki.dublincore.org/index.php/Cataloger_Scenarios,已没有龟标及RDF/XML格式的RDF表达]
提供10种场景,帮助编目员了解如何使用RDA取值词表、处理FRBR关系。链接到场景元数据的RDF表达,有龟标格式和RDF/XML格式。
·开放图书馆 Open Library
·开放研究在线 Open Research Online
·虚拟国际规范档 VIAF
·DBPedia
·Freebase
推荐阅读

[update 2012-7-24] Karen本人的博文
Coyle’s InFormation: Futures and Options(有墙)

Diane Hillmann谈书目框架转换行动

Diane Hillmann在我看来是一位理想主义的行动家。看到她和Jon Phipps的博文,谈LC的书目框架转换行动,涉及理想中的元数据世界未来。尽管他们的设想未必成为现实,但可解不少困惑,于是全文翻译。[少许地方仍然以方括号加感想,粗体也为本人所加]
Jon Phipps, Diane Hillmann, and Stuart Sutton
OMG项目团队成员,从左到右:Jon Phipps, Diane Hillmann, and Stuart Sutton

———-如果我们被问到———-
Metadata Matters: If We Were Asked (2012-7-4)

如果被问到(有时正是这样)我们对书目框架转换行动结果的看法,我们的回答会强调其技术和社会方面。

首先,鉴于若干不同场所的技术发展,考虑我们现在可以做的是把关联开放数据引入我们相对封闭的世界。一些具体建议:能够共享元数据,不仅是以单一共同“取值词表”表达的,而且是采用多种不同取值词表、以RDF、OWL/RDFS、RDFa、微数据及其他工具表达与发布的;[ONIX是采用兼容不同取值词表的很好例子];有指定使用这些“语义”砖块(DC应用纲要,以及W3C和DCMI的新兴溯源provenance规范)的方法,让机器使用、处理和发布数据,不需要中央启用节点;具有在现有与预期元数据方案间映射的技术与策略,彻底催毁社区之界的樊篱。

这是图书馆相关元数据的后MARC世界,原生于我们元数据的格式不再是其最重要的特征;无需做有损映射,去转换数据服务于不同需求;共享鲜有(最终没有)障碍。MARC所代表的巨大的价值──数十年来为回应大量使用案例而建立的语义(均完整存档于MARBI网站)──在我们移向一个不同领域时仍然极其重要。然而MARC语法产生自20世纪中期的需求,维持它所需的紧密共识模型,不再适用于当前及未来全球图书馆界的需求。[各做各的?]

这里适用一般的解释:有些技术并未完全到达黄金时期,然而在我们所生活的世界中,“完成的”更有可能指某些死去的,而非标准或工具开发的目标。我们个人非常熟悉的领域(无可惊讶)是词表管理和映射的补充领域。第一个是上线并运行为开放元数据注册(OMR)(尽管“持续的改进”引擎太过厌烦);第二个,映射是我们非常感兴趣的,已产生文章、论文及演讲(文后选择了部分),当然还有太多的博文(包括本文)和讨论组帖子。
我们相信,OMR及开发中的映射能力合在一起,能让遗产数据高效、损失最小地转向开放关联数据世界,并在处理中强化可得到的有用数据选项。*

在技术闪光中通常被忽视的是,有可能重新整合以往由于技术局限(及其他原因)而被撕裂的社区。在我们共同的过去,图书馆界创建数据时,基于一致使用AACR2和MARC的平台共享约定。某些图书馆社区──最突出的是法律和音乐──愿意妥协于更大图书馆社区内。其他如艺术图书馆和博物馆界及档案馆,则打破图书馆共识,另行开发更好地满足其需求的数据标准[曾经ISBD中是有档案的]。然而这些专业化标准,已在巨大的MARC谷仓之外,导致更多的谷仓。

如果意图是“取代MARC”(在某种程度上),那就是重置(re-placing)MARC及其内在局限,由我们世界的中心回到芸芸众生中的一员。转换的价值还在于扩展的能力,由半世纪前MARC形成的数据共享环境,到包括博物馆、出版社和档案馆在内的更广泛的感兴趣社区。满足消解这些谷仓、使我们的数据易于理解并以宿主方式重用的目标,将有助于开启我们已致力多年的“数据网”。Eric Miller [LC选择的MARC终结者]在Anaheim[ALA年会]书目框架更新会上解释得相当好:通过移到关联数据世界,我们实际上从定义上超出了图书馆/档案馆/博物馆(LAM)世界──走出去是一个相当大的世界。然而,与LAM界整体协作达到那儿,我们获益良多,……。仅仅把我们的视野局限在一个“MARC关联数据模型”可能是一个重要的起点,但低于我们的愿景需要延伸之所在

事实是,MARC在很长时间里不会离开,如果不是永远的话。图书馆如何转换有很多变数,取决于机构支持、短期和长期需求,以及现有的合作关系。由MARC转向关联数据世界的过程已经开始。RDA及其RDF词表是一个开端,如同MARC的完整RDF版(http://marc21rdf.info/)[也是OMR的成果]。多年来的ALA会前会、演讲及讨论已为这些改变准备了土壤。但是我们需要一个计划,采取某些实际步骤──这个步骤包括那些在战壕里工作却没有得到很大支持、而仍义无反顾前行的小组。书目框架转换行动不只是作为技术专家们的操场,因为在大多数情况下,并非技术制约着我们──是机构的惯性,以及难以找到使我们不相互对立的办法。我们需要的计划要平衡技术与社会、快速见效与长远势头、速度要求与费时且需构建支持的公开讨论

在我们看来,我们具有的是一个机会,去逆转长期以来元数据界的割据趋势,创造明显具有相似的挑战与利益的三个社区[LAM]间较少樊篱、更多数据交换的未来。我们认为,利用已极大改变的技术环境做这件事的时间已经到来。

* “哦,你只不过在此吹响自己的号角”──如此回应本博文很容易,也确实如此。但我们这么做是因为相信这很重要,而不仅仅是因为我们在做而相信其重要。我们相信我们已做和将做工作的价值,作为书目框架转换行动讨论的一部分,我们看到了很大的相关性。