关联数据 – 第 37 页 – 编目精灵III

LC正式启动以关联数据取代MARC

5月22日，美国国会图书馆（LC）宣布其“书目框架转变行动”启动建立模型工作，远洋师在书社会中及时通报。因为当时自己正好在做一件事不想中断，就没有跟进这个消息。昨天把积了几天的RSS订阅过了一遍，发现很奇怪的一个现象，尽管消息在ILFA-L和RDA邮件组中都发了，但国外博客中极少提及（甚至编目相关信息最多的catalogablog都没有），而对此事的评论也未见。书社会中雨师最早发博文，其评论担心新模型会变成另一种MARC。

下面是LC新闻稿的翻译：
The Library of Congress Announces Modeling Initiative (May 22, 2012)

LC很高兴地宣布，已经与Zepheira签约，帮助加速“书目框架行动”的启动。项目的主要工作是把MARC21格式翻译到关联数据模型，同时尽可能保留传统格式健壮且有利的方面。Zepheira给项目带来图书馆应用关联数据技术的广泛经验。
Zepheira团队由Eric Miller领导，他是早期W3C语义网行动的领导者，也曾在图书馆情报学界工作。公司在Miller先生领导下，活跃于“语义网和图书馆”标准的开发，以及支持关联数据技术与图书馆应用的开源工具方面。这些活动所体现的知识与经验，有助于构建核心数据模型，并支持作为新书目框架和相关服务基础的原型服务。
LC已要求Zepheira提出作为有力起点的模型供讨论，并对有助于本工作的、目前正进行的[其他]相关行动作出分析。LC期望，基于图书馆界有价值的反馈，以及所表达需求的自然进展，将改变或进一步调整提出的模型。最初的模型将作为演示系统/服务的工作基础，反过来也会用于进一步细化模型。期望这样的迭代反馈循环终将确保一个灵活的书目框架，一个健壮的参照规则，一个支持布署的基础架构，以及一个有效的升级计划，支持图书馆界从MARC转换到新框架。
LC现在将开始组织不同的方案，以使图书馆参与者更为广泛，并包括国际用户和合作者、不同类型信息机构和图书馆，以及图书馆供应商。我们将在书目框架转变行动网站（Bibliographic Framework Transition Initiative website）上随工作进展发布信息，特别是涉及重要事件时。
LC打算提出该行动的计划，在加州Anaheim的ALA年会上讨论并由图书馆界提供意见。Eirc Miller在这一更新时期将加入LC。（LC书目框架转换更新论坛，6月22日星期日，10:30 am-12:00，Anaheim Marriott Grand Salon A-C.）。

———-相关背景———-
关于Eric Miller其人：
The Digital Shift: Library of Congress Announces Modeling Initiative (May 24, 2012) By Matt Enis
LJ技术副主编、Matt Enis在The Digital Shift博客上介绍说，Eric Miller现任Zepheira公司总裁，曾是OCLC高级研究科学家、DCMI联合创始人（难怪上图那帮人跟他那么熟）。
Keven在书社会雨师日志下评论说Eric Miller是DC的发明人、RDF的起草人、W3C 语义小组的前负责人。

关于Zepheira公司：
Metadata Discussion Group: Library of Congress and Linked Data (May 23, 2012) by Jennifer Liss
印第安那大学图书馆的元数据讨论组博客介绍说，去年LC与Zepheira合作制作了Viewshare网站，为数字遗产馆藏提供一个平台，展示其时间线、标签云、交互地图有其他Web产品。
Viewshare网站以前远洋师好象也介绍过，也曾前往一观。

———关于LC的书目框架转换行动———-
准备抛弃MARC？美国国会图书馆启动“书目框架转变行动”(2011年5月24日)

国会图书馆书目框架计划总体规划 (2011年11月2日)

LC书目框架转换行动：首届更新论坛 (2012年2月7日)
即将在ALA年会上举办的应该是第二届吧

———相关评论———-
rainzen的书社会日志: 评国会图书馆的声明 (2012-05-23)

Nalsi的西文编目笔记III：【翻译】国会图书馆可能开始放弃MARC (五月 28th, 2011)
原文：Library of Congress May Begin Transitioning Away from MARC / Michael Kelley. LibraryJournal, May 26, 2011。作者提到“受到RDA的驱动”。

书蠹精：国际编目领域的重大新闻：美国国会图书馆可能放弃MARC格式 (2011-05-27)

“书目框架转变行动”引来一片赞扬 (2011年5月25日)

图书馆从传统数据观走向关联数据及语义网：五周年

上月在不列颠图书馆举办了名为“五年来”的研讨会，纪念为RDA走出20世纪而举办的“数据模型会议”（伦敦会议）五周年。会议网站上的介绍：
Seminar: Five Years On. British Library, April 26-27, 2012

2007年4月在不列颠图书馆举办了“数据模型会议”，与会者关心RDA《资源描述与检索》与其他元数据界（尤其是语义网环境中）所用模型的契合。此次会议通称“伦敦会议”，是图书馆由传统数据观转轨至关联数据及语义网的关键点。今年4月正好五周年。
DCMI英国联合DCMI国际及其他机构，于2012年4月27日主办为期一天的研讨会，描述自2007年来的进展以资纪念并展望未来的进一步协作。
与会者包括2007年与会者，及其他图书馆数据及语义网界的重要人物，论文由DCMI出版并免费在线发布。
伦敦会议极大促进了主要国际书目元数据模型的语义网表达的发展，除RDA本身外，还包括IFLA的功能需求系列和国际标准书目著录（ISBD）以及MARC。现在关注点集中在本活动的管理与可持续性，以及开发支持图书馆应用的高水平语义与数据结构。

———-会议报告———-

会议报告在网站上可以下载PDF版。报告人阵容强大、内容丰富且专深，以至部分超出我的理解能力。每个报告引用或总结一句话，概述我的感受（而非理解）。
√ RDA编制方JSC代表Barbara Tillett：背景与概述
简介2007年会议背景，总结因会议而成为现实的RDA元素词表注册历程
√ RDA词表注册主持人、DCMI/RDA工作组共同主席
1、Diane Hillmann：由建立RDA词表学到的
注册RDA词汇时面临的问题及采取的做法，关于XML和RDF的差别，……（不易理解，待细看）
2、Gordon Dunsire：（泰瑞）龟的梦想
纯漫画界面，梦想用一个三元组统治MARC21/RDA/FRBRer/DCT/ISBD/DCMI？（没有解说不易理解）[update 2012-8-10，或借用泰瑞龟指龟标Turtle -Terse RDF Triple Language]
√ IFLA代表Pat Riva和Mirna Willer：以RDF表达IFLA的ISBD和FRBR系列概念模型
ISBD和FRBR模型元素集命名域和取值词表已出版，并且由de-referencing服务提供利用。
√ 三个语义网应用实例：
1、剑桥大学：剑桥开放元数据项目(COMET) / by Edmund Chamberlain
印象特别深的一点：在开放自己数据的同时，用外部数据改善、强化自己的数据。[本地系统的MARC数据，不能用编程的方法更新，要改错可真是不容易]
2、不列颠图书馆：从标签到三元组：英国国家书目作为关联开放数据 / by Alan Danskin
报告中的数据与结论：2011年7月上线，每月处理2百万会话，说明权威网站提供有用数据是能得到利用的
3、Europeana数据模型 / by Robina Clayphan
Europeana数据收割自图书馆、博物馆、档案馆及音像库的数据，并用其他外部数据强化。
√ DCMI代表Tom Baker：五年过去了，下一步
展望未来五年，并介绍了前一日成立的二个小组：DCMI词表管理社区和书目元数据工作组──后者原为DCMI/RDA工作组。

———-乱弹———-
会议网站对上述报告均做了简介，除了二位RDA词表注册主持人，是一段相同的带小八卦的工作介绍：2007年会议第一天二人在不列颠图书馆的帕尼兹屋首遇，由于已消失在时间迷雾中的原因(For reasons lost in the mists of time)，他们被指定为DCMI/RDA工作组共同主席，负责开发RDA词表等工作（JSC致力于条款文本）。由此工作组着手在开放元数据注册（OMR）中建立这些词表。Gordon继续以类似方式帮助建立IFLA标准词表[IFLA命名域]，并与OMR团队合作把RDF版本MARC21加入OMR。──之前在自己的PPT中曾多次引用Gordon的内容，这下总算对他有了更多了解。

会议报告虽然看得懵懵懂懂，但有一个感觉应该不会错，即与会者均认为XML已经过时，RDF才是方向。现在已经有了不少实实在在的应用。

最后，剑桥PPT的总结发人深省：如果我们不能学会分享，没人再会跟我们玩了：
No-one will want to play with us if we cannot learn to share (p.30)

via Metadata Matters: Using the sub-property ladder / by Gordon Dunsire (May 13, 2012)
该博客由Diane Hillmann和Gordon Dunsire等合写，后者近段日子连发语义网相关博文，很难看懂
[update 2012-8-10: Diane博文BABIES, BATHWATER, AND OLD BROADS (2012-8-5)谈到伦敦会议：2006年时RDA遥遥无期，CC:DA打算向JSC提出不信任案。Diane在墨西哥举行的DC-2006上将草案给ALA出版社的Don Chatham看后，几个人一起讨论JSC与DCMI合作的可能性，之后才有伦敦会议。（查了下，DC-2006召开于10月初）]

伦敦会议网站：Data Model Meeting. British Library, London 30 April – 1 May 2007

IFLA语义网兴趣小组：Semantic Web Special Interest Group
属于信息技术部，2012年1月建立？

虚拟国际规范档数据集以ODC-By许可提供

虚拟国际规范档(VIAF)4月初成为OCLC的一项服务后，OCLC首席科学家Thomas B. Hickey在其博客Outgoing连续发布多项围绕VIAF的消息。此前博主已经有9个月未发博文，而在9个月前相当长一段时间的博文，也几乎都是关于VIAF的。要了解VIAF发展的历程，不可不看其博客。
本文标题就是其最新发布的消息：
VIAF Dataset (May 04, 2012)
VIAF数据集以ODC-By（开放数据共用-标示名称）许可提供，不影响其他以CC0（创作共用-公共域）许可发布的数据采用VIAF标识符，因为所用VIAF的URI即被视为致谢（By）。
鉴于VIAF的巨大数据量，其URI无疑会成为关联数据中的重要资源。
BTW，哈佛大学图书馆于4月22日发布其1200万条书目记录供下载，采用CC0协议，并得到OCLC认可（其中无疑有不少来自WorldCat的记录）。
via hangingtogether.org: Harvard bibliographic data released with prominent nod to OCLC (April 24th, 2012)

Uniform Titles in VIAF (April 23, 2012)
VIAF中加入统一题名，使得其规范记录的类型包括：个人名称、团体名称、地理名称（仅行政区名）和统一题名。

xA (April 16, 2012)
参见：xA：OCLC扩展虚拟国际规范档 (2012年4月18日)

VIAF Developments (April 09, 2012)
预告在2012年4月以ODC-by发布VIAF数据（看来滞后了几日）。为实现关联数据友好，数据描述以VoID（相互关联数据集词表）文档出版，并给出测试页。
—
参见：虚拟国际规范档移交OCLC (2012年4月5日)