NISO得到梅隆基金资助,评估新书目框架现状及未来需求

LC的书目框架转换行动,原说9月会有可供讨论的初步报告面世,至今没有音讯。
一年前,美国国家信息标准委员会(NISO)常务理事Todd Carpenter就有NISO主导取代MARC新标准制订之意,如今LC行动迟迟没有结果,或许更是显示NISO作用的时候──上月NISO得到梅隆基金近5万美元资助,用于评估新书目框架现状及未来需求。NISO设想的也是关联数据。

消息发布在11月号的NISO Newsline上:
NISO Receives Mellon Foundation Grant to Assess the Current State and Future Needs of a New Bibliographic Framework
“NISO得到安德鲁·梅隆基金48516美元资助,研究确定图书馆、高等教育和非营利网络信息界的需求,确保在一个不断网络化、关联数据环境中,能够使用和交换书目数据。资金将用于在美国举办一个面对面会议和四个全球网络会议,以及网络会议期间的工作组活动。会议将协调包括图书馆、技术人员、图书馆系统供应者及其他国际标准开发组织在内的主要群体的需求。”
“本计划的目标是吸引关键的利益相关者──来自图书馆、系统供应者、高等教育/研究机构,以及非传统书目信息用户──就基于关联数据的新书目框架所需的活动,发展出社区线路图的共识,识别标准开发所需的交换点,记录应当做功能性测试的区域,以给所有关联数据书目交换的参与者提供反馈。”

Todd Carpenter在卷首语中做了长篇评论(一直觉得Carpenter的卷首语可媲美《数字图书馆论坛》张主编):
NISO and the Future of Bib Exchange
在回顾了书目交换的历史、现状及NISO的作用后,介绍本资助项目:
“为集合这些跨界社区,推进走向新书目信息交换方式,NISO向安德鲁·梅隆基金提出一个项目设想,帮助方便这一问题的跨机构协作。……上月批准实施这项工作。本计划目标是组织一个跨不同兴趣社区及批评机构的组织。拨款将支持一次现场会议及一系列网络会议,讨论帮助在共享目标及达成这些目标的道路上取得共识。项目最终结果是一个报告,关注必需的发展共识的领域,将提出应该做的功能性测试点,可以向所有关联书目数据交换的参与者提供反馈。
他的结语:
“这是整个书目交换转换中的一小步;我们社区更大的项目是野心勃勃的。NISO对这一发展的时间表、兴趣和复杂性及对每个受影响机构的潜在分歧很清醒。反思这一计划的重要性,我认为关键的是对目标、需求及尽可能多的受影响参与者的期望的买进──包括以前不曾参与图书馆数据的新参与者,如语义网开发者,可以关联图书馆数据到更大的Web环境。协调、协作和共识对成功的结果至关重要。幸运的是,这些正是NISO在行动中设置的立场。没有一个组织能够单独推进任何具体方案,不管其在社区中的地位如何。我们希望从一开始就取得尽可能多的一致,推进前进过程中可以继续协作的共同方向。” [既是说自己,也是说LC吧]
最后,发英雄贴:“随着项目落地,接下来二个月中,NISO将与社区接触。如果你的机构对参与感兴趣,请联系NISO办公室。未来数周我们将提供更多项目信息。”

via NISO Newsline, November 2012
参见:NISO有意主导取代MARC新标准制订?(2011年11月6日)

[update 2014-2-13] 最新进展:NISO报告:通过新交换环境绘制航线:NISO书目路标行动
Charting a Course through a New Exchange Environment: The Niso Bibliograpic Roadmap Initiative / Todd Carpenter
ISQ:Information Standards Quarterly (Winter 2013, Vol.25 issue 4) p.33-34

丹麦国家书目的关联开放数据

今天看到书蠹精在新浪微博上发消息,提供丹麦国家书目关联数据计划的链接。链过去似曾相识:

Danish National Bibliography – Linked Open Data

DBC公司正开发关联开放数据版本的丹麦国家书目。开始的测试版只包含2010-2012年出版的图书及其创作者的规范数据。未来将扩大到影音,并链接到DBPedia及VIAF这样的外部来源。接下来的版本将覆盖2000-2012年间。

现提供自2010年以来的丹麦国家书目子集:
SPARQL endpoint: http://lod.dbc.dk/webui/

三元组文档(创作共用CC0 1.0 通用公共域声明许可)
图书(约4.7万图书记录,98万三元组):
turtle格式
RDF/XML格式

规范数据(约2.7万规范记录,24万三元组):
turtle格式
RDF/XML格式

———-数据模型与规范(Schema)———-
图书馆的数据模型基于不列颠图书馆的数据模型(2012年9月version 2.0)
有若干自定义术语──DBC Library Terms,命名空间为:xmlns:dbc

* 数据采用来自下列词汇表的属性
RDF Schema
Bibliographic Ontology [BIBO]
Bio: A Vocabulary for Biographical Information
British Library Terms
DBC Library Terms
Dublin Core [DC Term]
Event Ontology
FOAF: Friend of a Friend
WGS84 Geo Positioning
OWL
SKOS
RDF Schema
RDA [仍然只是第2组实体元素RDA Group 2 Elements]

* 提供到下属关联开放数据源的链接
Lexvo [语言、词汇、字符及其他人类语言相关实体信息的关联数据及语义网版本]
GeoNames(用于出版国)

关联数据词表管理

美国国家信息标准组织(NISO)的《信息标准季刊》(ISQ)自2011年起转为开放获取期刊,过刊也逐步回溯上网提供。最新一期为特刊《图书馆档案馆博物馆关联数据》
Information Standards Quarterly. Vol. 24, Issue 2/3 (Spring/Summer 2012). ISSN 1041-0031
Topic: Linked Data for Libraries, Archives, and Museums

本期由纽约大学元数据服务馆员Corey Harper担任客座内容编辑,专题文章“关联数据词表管理”:
Dunsire, Gordon, Corey Harper, Diane Hillmann, and Jon Phipps. Linked Data Vocabulary Management: Infrastructure Support, Data Integration, and Interoperability. Information Standards Quarterly, 2012 Spring/Summer, 24(2/3):4-13.

对全文意思把握不住。大致理解是:得到应用的元数据词表越来越多,在关联数据环境下其对照crosswalk/映射mapping/校准alignment更为复杂,需要探讨其管理问题。
以下只摘录若干事实,小标题为自拟提示,非照录原文。

应用纲要
(p.5) 2000年最早公开提出:Heery, Rachel, and Manula Patel. Application Profiles: Mixing and Matching Metadata Schemas. Ariadne, issue 25, September 24, 2000 [从该文看,源于UKOLN的DESIRE项目,希望在DC-8上推广]
(p.6) 实践则早自1999年:UKOLN DESIRE元数据注册,欧盟委员会资助的Schemas Project及其后继者CORES。

元数据注册
(p.6) 上述工具以registries著称。2002年DCMI发布其自己的元数据注册,由Heery和Wagner创始开发,其工作激发了很多其他注册,包括“开放元数据注册”。当前版DCMI注册是日本元数据基础体系注册、JISC信息环境元数据体系注册的基础。
(p.7) DCMI注册社区成立于1999年,成为讨论元数据注册的开发、管理和功能需求的集中地。2009年,UKOLN联合DCMI注册社区,进行一项元数据注册用户和所有者的调查,确认当前词表管理与注册间互操作的系统实践和功能需求。调查结果未出版,文中提供部分图表。

开放元数据注册(OMR)
(p.6) 始于NSF资助的美国国家数字图书馆项目──NSDL注册。现在扩展到图书馆界,存有RDA词表,IFLA的ISBD、FR家族模型,MARC21的RDF实验版。目前正致力于词表映射。
(p.8) RDA命名空间创建于2008年。截至2012年7月,元素集和很多取值词表仍处于不定状态。但由于状态和开发史可见,允许实验应用。
RDA命名空间的开发直接刺激了IFLA方面考虑其标准在语义网使用的潜力,因为RDA基于FR家族。ISBD正开发一个DC应用纲要,说明一条构造良好的ISBD的需求,包括元素的必备性、可重复状态,集成元素为高级说明,及取值词表来源。IFLA还在考虑翻译元素集和取值词表的最佳实践,因为它运作于多语言环境,其活动有7种官方语言。部分ISBD和FR家族命名空间已由英语译为西班牙和克罗地亚语。
复用RDA元素被排斥[?],因为自然流程是由模型细化应用。反之,ISBD不复用FR元素,因为对两个标准间的语义关系还没有完全一致的认识。受到校准ISBD和RDA元素以改进互操作工作的激励,已经开始讨论在IFLA和其他社区元数据元素间映射不受约束的命名空间:Dunsire, Gordon. Unconstrained namespaces. In: IFLA Namespaces Technical Group, IFLA Classification and Indexing Newsletter, no.45 (June 2012)(PDF)

欧洲国家图书馆发布目录数据的RDF表述
(p.8) 复用更为领域中性的词表DC、BIBO、FOAF,如LIBRIS、BL、剑桥大学。德国国家图书馆复用DC、FOAF、SKOS及RDA词汇。
(p.9) 特别是剑桥开放元数据项目(COMET),把所有转换工具、代码、过程均置于开源许可下。

元数据映射举例
(p.9) 图3:(书目资源的)数量RDA本体图(ISBD、FRBR、RDA、BIBO、MARC21、DC)

词表“校准”(Alignment)和DCMI词汇管理社区
(p.11) Michael Bergman在DC-2010的主旨报告,从词表激增的势头没有缓和的迹象,看到了对词表校准、同参引(co-referencing)和互操作的新兴需求。对“校准”的关注在某种程度上类似于已有的、在基于记录(通常为XML)的元数据结构间开发对照表(crosswalk)。词汇校准,识别个别元数据元素间的对应及其他关系类型,帮助这些属性应用于其来源词表环境之外。
然而,开放关联数据环境概念的扩展,我们面临的情况比开始所见的更为复杂。……DC-2011会前会……导致了DCMI词汇管理社区的成立。

关联开放词汇项目(LOV)
(p.11-12) Bernard Vatant及其团队收集了现有属性词表信息,探索其相互间关系,如某个是否基于另一个,或者给予扩展、普遍化,或声明和另一词表的等价物。LOV项目的研究成果应用:关联开放数据词表之元数据推荐(Metadata Recommendations For Linked Open Data Vocabularies, version 1.1, 2012-8-19)

DC与Schemar.org映射
(p.12) Bernard也提出建议在DC属性和schema.org词表之间做映射,DCMI的一个工作组正采用GitHub管理这样一个映射原型集:DC – Schema.org Mappings [目前对应6个类、27个属性]

via NISO Press Release: NISO Publishes Themed Issue of Information Standards Quarterly on Linked Data for Libraries, Archives, and Museums (10 Sep 2012)