图书馆标准巴别塔──Schema.org将图书馆连接到web

这是OCLC技术布道者Richard Wallis的观点。
Richard Wallis因关联技术加盟OCLC。在刚结束的IFLA赫尔辛基年会的关联数据圆桌会议(OCLC Linked Data Round Table)上,他在名为《图书馆关联数据进展》报告中宣布,WorldCat关联数据提供一个子集供下载。
参见:WorldCat关联数据子集批量下载(附OCLC的其他关联数据)(2012年8月21日)

报告前面部分列举IFLA 2010年会到2012年会的两年间,图书馆界发布的众多关联数据(附后,包括韩国国家图书馆),后面部分介绍OCLC发布的各个关联数据项目及ODC-BY许可。连接两者的,就是提出“图书馆标准巴别塔”(p.27),以及“Schema.org将图书馆链接到web”(p.61),说明WorldCat采用Schema.org及图书馆扩展的原因。

最近看了各图书馆发布关联数据所用命名空间,对“图书馆标准巴别塔”之说极为认同。Wallis在页面标出的图书馆标准有12个:Bibo, Dublin Core, EAD, FRAD, FRBR, FRSAR, ISBD, MARC, MARCXML, MODS, Onix, RDA;所列不列颠图书馆数据模型(PDF格式)中所采用的命名空间有14个:blt, rdf, rdfs, owl, xsd, dct, isbd, skos, bibo, bio, foaf, event, org, geo。因之OCLC的选择是放弃图书馆标准,采用搜索引擎的标准schema.org,并辅以OCLC的图书馆扩展(library extension,或也有望被纳入schema.org吧)。
参见:Schema.org的图书馆扩展(2012年6月22日)

Wallis的说法是:共享通往Web的道路(p.64):
Schema.org linking libraries to the web(Schema.org将图书馆链接到web)
no replacement for rich bibliographic metadata(不取代丰富的书目元数据)
easily consumed & merged across domains(易于跨域消费与合并)
a powerful complement to it(指图书馆扩展)

于是想,LC书目框架转换行动,会弄出一个什么样的模型呢?给巴别塔添砖加瓦吗,还是像schema.org那样来个一统图书馆天下?

PPT:Richard Wallis. Library Linked Data Progress. IFLA Helsinki, 13 August 2012(有墙)
OCLC官网消息: OCLC provides downloadable linked data file for the 1 million most widely held works in WorldCat, 14 August 2012
Via Data Liberate: Get Yourself a Linked Data Piece of WorldCat to Play With / By Richard Wallis on August 12, 2012

会议其他报告:IFLA语义网特别兴趣小组(SWSIG)网站消息,Presentations from OCLC Linked Data round table available
(均在目前被墙的slideshare)
– Neil Wilson, British Library – http://www.slideshare.net/nw13/oclc-linked-data-roundtable-event-ifla-2012
– Emmanuelle Bermes, Centre Pompidou – http://www.slideshare.net/Figoblog/ifla-2012-oclc-linked-data-round-table
– Martin Malmsten, National Library of Sweden – http://www.slideshare.net/geckomarma/ifla-2012-oclc-semantic-web-roundtable

———-图书馆关联数据进展———-
Richard Wallis报告中列举的IFLA 2010年会到2012年会间发布的图书馆关联数据:
data.bnf.fr(法国国家图书馆)
datos enlazados en la BNE(西班牙国家图书馆)
Europeana Linked Open Data
Web NDL Authorities(日本国会图书馆)
LC Linked Data Service(美国国会图书馆)
The Open Library(thedatahub.org/dataset/openlibrary)
Zeitschriftendatanbank: Linked Data(德国:期刊资料库)
Linked Data Service of the German National Library(德国国家图书馆)
National Library of Korea: Linked Data(韩国国家图书馆)
VIAF
DDC
FAST Linked Data
British National Bibliography(英国国家书目)
W3C Library Linked Data Incubator Group
LC: Bibliographic Framework Transition Initiative
WorldCat

WorldCat关联数据子集批量下载(附OCLC的其他关联数据)

在刚结束的IFLA年会上,Richard Wallis宣布提供WorldCat关联数据的批量下载──自然不会是全部,而是一个子集,给大家玩玩,可在本地安装后用SPARQL做试验:
书目记录数:120万(对照:WorldCat全部记录2.5亿)
入选条件:超过250个图书馆收藏
文件大小:1GB
三元组数:8千万
格式:RDF n-triples
数据集描述:WorldCat VoID Dataset Description(含dataDump下载网址)

via 书社会远洋过客转贴 2012-8-18
原博文:Data Liberate: Get Yourself a Linked Data Piece of WorldCat to Play With / By Richard Wallis on August 12, 2012
OCLC官网消息: OCLC provides downloadable linked data file for the 1 million most widely held works in WorldCat, 14 August 2012

——–关于OCLC及其关联数据的八卦———-
OCLC一直很注重对自己权利的保护,事例如:
– 2003年图书馆酒店商标案
参见:OCLC与图书馆酒店的故事:版权与商标(2006年9月25日)
http://catwizard.net/posts/20060925205225.html
– 2009年闹得沸沸扬扬的WorldCat记录使用政策
参见:编目与元数据2009(2010年1月3日)
http://catwizard.net/posts/20100103152717.html
圖書館觀點:關於「WorldCat書目記錄使用及轉出政策」(1st Apr 2009),有墙
后续影响有:瑞典国家图书馆终止加入WorldCat谈判(2011年12月22日)
http://catwizard.net/posts/20111222231009.html

OCLC大规模加入此轮关联数据潮流,不过对权利的保护一如既往:
– VIAF提供批量下载,但那只是OCLC的一项服务,内容并不属于OCLC
参见:虚拟国际规范档移交OCLC(2012年4月5日)
http://catwizard.net/posts/20120405222312.html
– FAST提供批量下载,是LCSH部分内容的分面版,内容也不属于OCLC
参见:FAST: 主题词分面应用(2007年11月28日)
http://catwizard.net/posts/20071128205457.html
– DDC23版全部23,000多个分类号和类名在dewey.info上发布为关联数据。得知后在网站上找了半天,也没有发现完整的DDC(只有原来的千分表)。后来远洋师告知,只是assignable,并不免费公开DDC──那还是要卖银子的。
– 与DDC几乎同时发布的还有WorldCat所有书目记录,显示在每条记录的详细页面下
参见:WorldCat也关联数据了(2012年6月21日)
http://catwizard.net/posts/20120621214628.html
– 下载:WorldCat子集
– 关联数据发布中采用开放数据许可ODC-BY而非公共域许可CC0
参见:虚拟国际规范档数据集以ODC-By许可提供(2012年5月5日)
http://catwizard.net/posts/20120505223629.html
官网消息:OCLC recommends Open Data Commons Attribution License (ODC-BY) for WorldCat data (6 August 2012)
CC网站对ODC-BY和CC0的分析:Library catalog metadata: Open licensing or public domain? / Timothy Vollmer (August 14th, 2012) ,感谢Nalsi提供信息
ODC-BY: Open Data Commons – Attribution License
[update] 指南:OCLC linked data attribution guidelines