OCLC对BIBFRAME和Schema.org书目扩展的立场

2013年6月,OCLC研究部发布了一个关于BIBFRAME和Schema.org书目扩展模型关系的工作文件:
The Relationship between BIBFRAME and the Schema.org ‘Bib Extensions’ Model: A Working Paper / Carol Jean Godby. Dublin, Ohio: OCLC Research, 2013. (pdf,41页)
文件第2部分详述OCLC主导的Schema.org书目扩展SchemaBibEx,认为已足够成熟,可以用于WorldCat关联数据标记的下一次更新。据称按计划2013年下半年公布,不料因未得到(SchemaBibEx小组)认同,直到一年后的上个月底,WorldCat关联数据标记还是老样子(这几天发现略有变化,出现了bgn:命名空间属性)。
文件第4部分的表4.1“SchemaBibEx和BIBFRAME未来开发中参与的职责”,列出了SchemaBibEx与BIBFRAME合作,以及两方面各自在建模、各方参与、细化、映射和演示5个方面的活动,可从中看OCLC在SchemaBibEx方面打算做的工作。表中BIBFRAME主导的主要是与MARC有关的,而双方合作及SchemaBibEx主导的与BIBFRAME有关的工作是:
活动1、建模,合作:建模关键概念,包括FRBR第1组实体、收藏集(collection)、丛编和馆藏(Holding)。
活动3、细化,合作:确保概念的关联数据友好的。
活动4、映射,合作:协调不一致。
SchemaBibEx主导:映射BIBFRAME概念到Schema.org
活动5、演示,合作:协调不一致;演示附加效果。
SchemaBibEx主导:开发并公开SchemaBibEx模型的实施和BIBFRAME衍生。

可以说,文件表明了OCLC发展SchemaBibEx的决心及计划。即使现在OCLC以BiblioGraph.net(bgn:)代替了SchemaBibEx,扩展Schema.org的决心与计划并未改变。
本工作报告是OCLC关联数据研究(OCLC Linked Data Research)活动的一部分。本月初OCLC在网站发布新闻,宣布和LC共同澄清图书馆关联数据方法,也可以说再次表明了自己的立场:
OCLC and the Library of Congress — working together to clarify approaches to library linked data (04 December 2014)
双方的合作始于2014年8月,9月联合技术会后每月沟通。讨论论题包括:
§ BIBFRAME试验记录的结构与内容
§ WorldCat馆藏使用案例
§ BIBFRAME和SchemaBibExtend词表的异同
双方将同撰写一份白皮书,澄清如何组装两种方法以表达图书馆的特定需求与挑战。
在下月举行的ALA 2015仲冬会议上将会有相关活动。

———-关于“Schema.org书目扩展”的八卦———-
去年6月时Godby在BIBFRAME邮件组中发布文件上线消息。本想看完文件后写一篇OCLC对BF态度的博文,不料由于BF邮件组中的讨论,吸引力被引向了Schema书目扩展的进展,最后就把写博的事忘了。
作为W3C的Schema书目扩展小组的成员,Karen Coyle首先对报告述及的“重新设计的主要目标是使用已在Schema.org中定义的概念改进FRBR等级表达”(p.11)提出异议,认为这是OCLC的想法,小组“未在此点上取得一致,未以在schema.org中表达FRBR为目标”。其后Coyle在另一个回复中更指出,“报告中把很多实则来自OCLC的想法错误地归因于schemaBibEx小组”。
原定一年的Schema书目扩展活动到2014年2月为时一年半,仍未取得多少成果,想来原因正在于OCLC与小组其他成员在不少问题上未能取得一致。OCLC及此项目负责人Richard Wallis对成立这个小组的决定大概很郁闷,因之在4月另起炉灶,注册BiblioGraph.net网站,以bgn:命名空间继续扩展Schema.org之路。

参见:
解惑Schema书目扩展(2014年1月29日)
WorldCat作品关联数据问答(2014年3月7日)
问题之一:WorldCat作品如何与BIBFRAME模型形成交集?
OCLC低调注册BiblioGraph.net扩展Schema.org(2014年12月1日)

OCLC低调注册BiblioGraph.net扩展Schema.org

OCLC主导Schema.org的书目扩展W3C小组(Schema Bib Extend Community Group),原定自2012年9月起为期一年结束。从BIBFRAME邮件组中去年6月对OCLC关于BIBFRAME和Schema书目扩展报告(The Relationship between BIBFRAME and the Schema.org ‘Bib Extensions’ Model: A Working Paper / Carol Jean Godby. Dublin, Ohio: OCLC Research, 2013. (pdf,41页))的反映看,小组成员意见不一是显然的。由于进展不佳,正式提交的建议很少。看SchemaBibEx网站wiki部分,原来一、二个月一次的小组会议,到2014年2月后就已停止,内容也只更新到4月初。感觉OCLC已经放弃在此继续与其他参与者斗智斗勇了,但也没见什么依据。
偶而在OCLC网站2014年9月关于VIAF词表的一篇报道中,看到词表中有BiblioGraph.net域名,很是陌生。顺链接而去,发现了这个用来扩展Schema.org的网站。网站没有OCLC的LOGO,只是很低调地在服务条款(Terms of service)中说由OCLC主办。查得OCLC在4月16日注册了此域名,通过搜索引擎和OCLC网站查,竟然未见有过报道。OCLC如此低调处理,相当奇怪!

什么是BiblioGraph.net? 【有墙】
“本网站提供一组规范,用于描述图书馆和相关领域中书目和文化遗产资源与收藏的概念、实体和关系。基于schema.org词表,BiblioGraph.net增加在这些特定领域中特别重要的相关术语和实体。”

2012年OCLC发布WorldCat关联数据时,除了schema.org及其图书馆扩展外,还用到包括DC、FOAF、VIAF等在内的命名空间(Experimental “library” extension vocabulary)。此次注册BiblioGraph.net(命名空间简称:bgn:),意在未来将OCLC书目关联数据所用命名空间数量减小到最低2个:
BiblioGraph.net规范结构(Schema Structure
“本网站所描述的规范被汇集以反映共享原则,以及schema.org定义的核心类型和属性。BiblioGraph.net的编者将追踪schema.org已发布术语的变化,更新本网站加以反映。”
“当schema.org没有适当术语,会寻求来自SchemaBib Extend W3C社区小组的建议作为合适的选项。最后,术语加入BiblioGraph.net命名空间,常会有来自其他合适词表如DC、Bibo等的例子。目标是确保在BiblioGraph.net描述数据的命名空间数量在最小限度,优先为仅二个——schema: 和 bgn: ”。

这想法和BIBFRAME颇为相似,也就是说除了schema.org外,不重用其他命名空间,而是把其他词表术语纳入自己的命名空间。另外,所谓“寻求来自SchemaBib Extend W3C社区小组的建议”,应该更多的属于外交辞令。
从前面提及的那篇VIAF词表报道看(VIAF RDF Vocabulary Changes and Additions,03 September 2014),VIAF词表中原来来自DBPedia、RDA和FOAF命名空间的类与属性,纷纷被schema:取代,还新增了不少bgn:属性,据说体现在9月16日的VIAF更新中。看来规范(VIAF)比书目更早采用bgn——目前看WorldCat时,用的仍是二年前的library扩展。[update 2014-12-20 昨天访问,在某记录下已经看到两个bgn属性,但都不是取代library扩展的:一个是新增bgn:inSupportOf,一个是代替j.1:的bgn:Thesis]
另一个值得注意的是,VIAF新增了两个FRBR类(作品、内容表达),采用的不是IFLA官方版,而是2005年Ian Davis和Richard Newman的:Expression of Core FRBR Concepts in RDF。为什么bgn自己不定义?

OCLC 关联数据项目调查结果:机构、成果、消费、发布、技术、建议

OCLC研究部2014年7月7日到8月15日在网上做了一个关联数据项目与服务调查,针对图书馆档案馆发布关联数据,以及在自己的数据或应用中摄入关联数据资源,目的在于了解谁、为什么使用关联数据。
调查信息通过其博客hangingtogether.org发布,8月底Karen Smith-Yoshimura在该博客上分6次发布了调查分析结果,并提供原始调查结果汇总表供下载。
调查对象要求是已经或正在实施关联数据项目的,但在收到的122个参与者,有26个目前并未实施,只是有计划或兴趣。其余96个实施了172个关联数据项目/服务,其中76个项目被描述:25个消费关联数据,4个发布关联数据,47个既消费也发布。对项目进行描述的47个机构有很好的国际代表,过半在美国,其余来自14个国家:澳大利亚、加拿大、捷克、法国、德国、爱尔兰、意大利、荷兰、挪威、新加坡、韩国、西班牙、瑞士、英国。调查得到的数据及分析,对了解当前国际上图博档领域关联数据应用现状很有参考价值。
以下概述7篇博文内容:

So who is using linked data? And for what? / July 7, 2014
发布调查邀请,说明调查目的等(调查链接已失效)

Linked Data Survey results 1 – Who’s doing it (Updated) / August 28, 2014
关联数据调查结果1:谁在做
调查结果概述(见前),参与调查机构、日均请求、是否成功达到期望结果、机构中参与的部门等

Linked Data Survey results 2: Examples in production (Updated) / August 29, 2014
关联数据调查结果2:成果举例
关联数据项目简介

Linked Data Survey results 3–Why and what institutions are consuming (Updated) / September 1, 2014
关联数据调查结果3:为什么及什么机构在消费
消费关联数据的理由、方法、关联数据源、面临的障碍或挑战。

用得最多的关联数据源
* id.loc.gov – 30
* DBpedia – 25
* GeoNames – 25
* VIAF – 24

Linked Data Survey results 4–Why and what institutions are publishing (Updated) / September 3, 2014
关联数据调查结果4:为什么及什么机构在发布
发布关联数据的理由、发布的数据类型、许可、面临的障碍或挑战。

用得最多的RDF词表与本体
* SKOS – 38
* FOAF – 30
* Dublin core terms – 29
* Dublin core – 27
* Schema.org – 22
(关注:RDA–10;BIBFRAME–6)

Linked Data Survey results 5 – Technical details / September 5, 2014
关联数据调查结果5:技术细节
访问方法、序列化、消费技术、发布技术。

访问方法前3位
* Web pages 网页 – 25
* SPARQL Endpoint – 24
* file dump 文件下载 – 23

序列化前3位
* RDF/XML – 47
* Turtle – 30
* RDF/JSON – 26

Linked Data Survey results 6 – Advice from the implementers / September 8, 2014
关联数据调查结果6:来自实施者的忠告
建议、资源推荐、调查结果源数据下载

忠告:困难的是什么?[1]组织支持与人员配置;[2]词表;[3]技术;[4]法律问题……

[update 2014-10-29] 参见荔园图志:OCLC发布关联数据调查报告 (2014-10-21)