LC正式启动以关联数据取代MARC

5月22日,美国国会图书馆(LC)宣布其“书目框架转变行动”启动建立模型工作,远洋师在书社会中及时通报。因为当时自己正好在做一件事不想中断,就没有跟进这个消息。昨天把积了几天的RSS订阅过了一遍,发现很奇怪的一个现象,尽管消息在ILFA-L和RDA邮件组中都发了,但国外博客中极少提及(甚至编目相关信息最多的catalogablog都没有),而对此事的评论也未见。书社会中雨师最早发博文,其评论担心新模型会变成另一种MARC。

下面是LC新闻稿的翻译:
The Library of Congress Announces Modeling Initiative (May 22, 2012)

LC很高兴地宣布,已经与Zepheira签约,帮助加速“书目框架行动”的启动。项目的主要工作是把MARC21格式翻译到关联数据模型,同时尽可能保留传统格式健壮且有利的方面。Zepheira给项目带来图书馆应用关联数据技术的广泛经验。
Zepheira团队由Eric Miller领导,他是早期W3C语义网行动的领导者,也曾在图书馆情报学界工作。公司在Miller先生领导下,活跃于“语义网和图书馆”标准的开发,以及支持关联数据技术与图书馆应用的开源工具方面。这些活动所体现的知识与经验,有助于构建核心数据模型,并支持作为新书目框架和相关服务基础的原型服务。
LC已要求Zepheira提出作为有力起点的模型供讨论,并对有助于本工作的、目前正进行的[其他]相关行动作出分析。LC期望,基于图书馆界有价值的反馈,以及所表达需求的自然进展,将改变或进一步调整提出的模型。最初的模型将作为演示系统/服务的工作基础,反过来也会用于进一步细化模型。期望这样的迭代反馈循环终将确保一个灵活的书目框架,一个健壮的参照规则,一个支持布署的基础架构,以及一个有效的升级计划,支持图书馆界从MARC转换到新框架。
LC现在将开始组织不同的方案,以使图书馆参与者更为广泛,并包括国际用户和合作者、不同类型信息机构和图书馆,以及图书馆供应商。我们将在书目框架转变行动网站(Bibliographic Framework Transition Initiative website)上随工作进展发布信息,特别是涉及重要事件时。
LC打算提出该行动的计划,在加州Anaheim的ALA年会上讨论并由图书馆界提供意见。Eirc Miller在这一更新时期将加入LC。(LC书目框架转换更新论坛,6月22日星期日,10:30 am-12:00,Anaheim Marriott Grand Salon A-C.)。

———-相关背景———-
关于Eric Miller其人:
The Digital Shift: Library of Congress Announces Modeling Initiative (May 24, 2012) By Matt Enis
LJ技术副主编、Matt Enis在The Digital Shift博客上介绍说,Eric Miller现任Zepheira公司总裁,曾是OCLC高级研究科学家、DCMI联合创始人(难怪上图那帮人跟他那么熟)。
Keven在书社会雨师日志下评论说Eric Miller是DC的发明人、RDF的起草人、W3C 语义小组的前负责人。

关于Zepheira公司:
Metadata Discussion Group: Library of Congress and Linked Data (May 23, 2012) by Jennifer Liss
印第安那大学图书馆的元数据讨论组博客介绍说,去年LC与Zepheira合作制作了Viewshare网站,为数字遗产馆藏提供一个平台,展示其时间线、标签云、交互地图有其他Web产品。
Viewshare网站以前远洋师好象也介绍过,也曾前往一观。

———关于LC的书目框架转换行动———-
准备抛弃MARC?美国国会图书馆启动“书目框架转变行动”(2011年5月24日)

国会图书馆书目框架计划总体规划 (2011年11月2日)

LC书目框架转换行动:首届更新论坛 (2012年2月7日)
即将在ALA年会上举办的应该是第二届吧

———相关评论———-
rainzen的书社会日志: 评国会图书馆的声明 (2012-05-23)

Nalsi的西文编目笔记III:【翻译】国会图书馆可能开始放弃MARC (五月 28th, 2011)
原文:Library of Congress May Begin Transitioning Away from MARC / Michael Kelley. LibraryJournal, May 26, 2011。作者提到“受到RDA的驱动”。

书蠹精:国际编目领域的重大新闻:美国国会图书馆可能放弃MARC格式 (2011-05-27)

“书目框架转变行动”引来一片赞扬 (2011年5月25日)

图书馆从传统数据观走向关联数据及语义网:五周年

上月在不列颠图书馆举办了名为“五年来”的研讨会,纪念为RDA走出20世纪而举办的“数据模型会议”(伦敦会议)五周年。会议网站上的介绍:
Seminar: Five Years On. British Library, April 26-27, 2012

2007年4月在不列颠图书馆举办了“数据模型会议”,与会者关心RDA《资源描述与检索》与其他元数据界(尤其是语义网环境中)所用模型的契合。此次会议通称“伦敦会议”,是图书馆由传统数据观转轨至关联数据及语义网的关键点。今年4月正好五周年。
DCMI英国联合DCMI国际及其他机构,于2012年4月27日主办为期一天的研讨会,描述自2007年来的进展以资纪念并展望未来的进一步协作。
与会者包括2007年与会者,及其他图书馆数据及语义网界的重要人物,论文由DCMI出版并免费在线发布。
伦敦会议极大促进了主要国际书目元数据模型的语义网表达的发展,除RDA本身外,还包括IFLA的功能需求系列和国际标准书目著录(ISBD)以及MARC。现在关注点集中在本活动的管理与可持续性,以及开发支持图书馆应用的高水平语义与数据结构。

———-会议报告———-

会议报告在网站上可以下载PDF版。报告人阵容强大、内容丰富且专深,以至部分超出我的理解能力。每个报告引用或总结一句话,概述我的感受(而非理解)。
√ RDA编制方JSC代表Barbara Tillett:背景与概述
简介2007年会议背景,总结因会议而成为现实的RDA元素词表注册历程
√ RDA词表注册主持人、DCMI/RDA工作组共同主席
1、Diane Hillmann:由建立RDA词表学到的
注册RDA词汇时面临的问题及采取的做法,关于XML和RDF的差别,……(不易理解,待细看)
2、Gordon Dunsire:(泰瑞)龟的梦想
纯漫画界面,梦想用一个三元组统治MARC21/RDA/FRBRer/DCT/ISBD/DCMI?(没有解说不易理解)[update 2012-8-10,或借用泰瑞龟指龟标Turtle -Terse RDF Triple Language]
√ IFLA代表Pat Riva和Mirna Willer:以RDF表达IFLA的ISBD和FRBR系列概念模型
ISBD和FRBR模型元素集命名域和取值词表已出版,并且由de-referencing服务提供利用。
√ 三个语义网应用实例:
1、剑桥大学:剑桥开放元数据项目(COMET) / by Edmund Chamberlain
印象特别深的一点:在开放自己数据的同时,用外部数据改善、强化自己的数据。[本地系统的MARC数据,不能用编程的方法更新,要改错可真是不容易]
2、不列颠图书馆:从标签到三元组:英国国家书目作为关联开放数据 / by Alan Danskin
报告中的数据与结论:2011年7月上线,每月处理2百万会话,说明权威网站提供有用数据是能得到利用的
3、Europeana数据模型 / by Robina Clayphan
Europeana数据收割自图书馆、博物馆、档案馆及音像库的数据,并用其他外部数据强化。
√ DCMI代表Tom Baker:五年过去了,下一步
展望未来五年,并介绍了前一日成立的二个小组:DCMI词表管理社区和书目元数据工作组──后者原为DCMI/RDA工作组。

———-乱弹———-
会议网站对上述报告均做了简介,除了二位RDA词表注册主持人,是一段相同的带小八卦的工作介绍:2007年会议第一天二人在不列颠图书馆的帕尼兹屋首遇,由于已消失在时间迷雾中的原因(For reasons lost in the mists of time),他们被指定为DCMI/RDA工作组共同主席,负责开发RDA词表等工作(JSC致力于条款文本)。由此工作组着手在开放元数据注册(OMR)中建立这些词表。Gordon继续以类似方式帮助建立IFLA标准词表[IFLA命名域],并与OMR团队合作把RDF版本MARC21加入OMR。──之前在自己的PPT中曾多次引用Gordon的内容,这下总算对他有了更多了解。

会议报告虽然看得懵懵懂懂,但有一个感觉应该不会错,即与会者均认为XML已经过时,RDF才是方向。现在已经有了不少实实在在的应用。

最后,剑桥PPT的总结发人深省:如果我们不能学会分享,没人再会跟我们玩了
No-one will want to play with us if we cannot learn to share (p.30)

via Metadata Matters: Using the sub-property ladder / by Gordon Dunsire (May 13, 2012)
该博客由Diane Hillmann和Gordon Dunsire等合写,后者近段日子连发语义网相关博文,很难看懂
[update 2012-8-10: Diane博文BABIES, BATHWATER, AND OLD BROADS (2012-8-5)谈到伦敦会议:2006年时RDA遥遥无期,CC:DA打算向JSC提出不信任案。Diane在墨西哥举行的DC-2006上将草案给ALA出版社的Don Chatham看后,几个人一起讨论JSC与DCMI合作的可能性,之后才有伦敦会议。(查了下,DC-2006召开于10月初)]

伦敦会议网站:Data Model Meeting. British Library, London 30 April – 1 May 2007

IFLA语义网兴趣小组:Semantic Web Special Interest Group
属于信息技术部,2012年1月建立?

虚拟国际规范档数据集以ODC-By许可提供

虚拟国际规范档(VIAF)4月初成为OCLC的一项服务后,OCLC首席科学家Thomas B. Hickey在其博客Outgoing连续发布多项围绕VIAF的消息。此前博主已经有9个月未发博文,而在9个月前相当长一段时间的博文,也几乎都是关于VIAF的。要了解VIAF发展的历程,不可不看其博客。
本文标题就是其最新发布的消息:
VIAF Dataset (May 04, 2012)
VIAF数据集以ODC-By(开放数据共用-标示名称)许可提供,不影响其他以CC0(创作共用-公共域)许可发布的数据采用VIAF标识符,因为所用VIAF的URI即被视为致谢(By)。
鉴于VIAF的巨大数据量,其URI无疑会成为关联数据中的重要资源。
BTW,哈佛大学图书馆于4月22日发布其1200万条书目记录供下载,采用CC0协议,并得到OCLC认可(其中无疑有不少来自WorldCat的记录)。
via hangingtogether.org: Harvard bibliographic data released with prominent nod to OCLC (April 24th, 2012)

Uniform Titles in VIAF (April 23, 2012)
VIAF中加入统一题名,使得其规范记录的类型包括:个人名称、团体名称、地理名称(仅行政区名)和统一题名。

xA (April 16, 2012)
参见:xA:OCLC扩展虚拟国际规范档 (2012年4月18日)

VIAF Developments (April 09, 2012)
预告在2012年4月以ODC-by发布VIAF数据(看来滞后了几日)。为实现关联数据友好,数据描述以VoID(相互关联数据集词表)文档出版,并给出测试页。

参见:虚拟国际规范档移交OCLC (2012年4月5日)