解惑Schema书目扩展

OCLC在2012年中发布了WorldCat关联数据,采用搜索引擎巨头的标准Schema.org作元数据标记,对Schema.org没有的词汇(vocabulary)做了实验性的“图书馆扩展”。后来,“图书馆扩展”(“library” extension)变成了“书目扩展”(Bib Extend),一个W3C小组(Schema Bib Extend Community Group,简称SchemaBibEx):“小组的任务是讨论与准备扩展Schema.org规范的建议,以改进书目信息标记与共享。小组寻求对向W3C WebSchemas小组建议的共享与支持,本身不产生技术规范”。
看小组网站,创建人即WorldCat关联数据项目的重要人物Richard Wallis,对OCLC发起这个小组的意图有所猜测。发起会议为2012年9月,原定为期一年却仍结束无期;小组有持续的会议,却没看到提出什么建议。还在其他场合看到一些讨论甚至争论——总之,对SchemaBibEx有太多不明之处。
这几天仔细看《信息标准季刊》2013年冬辑,Wallis的文章基本可以解惑。从下内容摘自该文不同部分,编号及小标题自拟【点评】:

Richard Wallis: Schema Bib Extend. ISQ:Information Standards Quarterly, Winter 2013, Vol.25, issue 4:30-32

一、任务
一个W3C社区小组,专注在书目领域建立共识,提交建议给WebSchemas小组,扩展Schema.org词表,强化其描述书目资源的能力。

二、成立缘由
依照Schema.org背后那些(机构)的指引,在W3C的帮助下成立开放小组。W3C相信,来自兴趣方的小组建议会比个人带来更多份量【应该说是多方比OCLC一方更有份量】。同时,这样一个小组会带来影响建议形成过程的有信息量的讨论和使用案例。

三、小组成员
成员超过80人,代表对书目领域感兴趣的个人或机构。所代表的机构包括数个国家图书馆、图书馆系统厂商、出版者、W3C、大学、合作机构和联盟。

四、已提出的建议
小组定期召开电话会议,通过社区wiki,已形成并提交数个有关馆藏引文有声书专题的建议给WebSchemas小组。

五、思路变化
最初建议花大量精力识别很多Schema.org中没有的书目词汇术语【对照法】。
(现在)通过把Schema.org词表用于在书目领域中描述资源及其关系,弄清并探索问题。在此过程中,检查书目资源的样例网页,看什么Schema.org标记合适。这一方法的结果,一是认识到Schema.org有多么适合描述我们的资源,二是识别了特定的覆盖缺口——比如没有有声书类。【查遗补缺法:用Schema.org标记书目记录,从而了解缺少什么】
有些案例,最初推测需要新类/属性,后来清楚只要有建议、文档或样例就够了;另外一些案例,所需的只是建议对Schema.org文档中描述做出微调。【换言之,以前对Schema了解不够】
以“馆藏”为例,最初想法可能导致建议提出图书馆专用的类与属性。但是使用Schema.org的Offer类——对其文档描述做某些调节以考虑到offers除了出售外还可能是出借或共享——就足以满足图书馆的使用案例——可获取。随后剩下的就是某些细致的具体工作,用新属性描述图书馆特定的事比如架标、索取号等。【也就是说,尽可能用已有类及属性,可做些微调,或在现有类下增加某些属性】

六、未来预计
尽管有很多事情要做,在小组第二年结束前,可能大部分问题都被处理了。

七、采用
除了OCLC的WorldCat,开源图书馆系统如Evergreen和Koha已在其用户界面实施代码以爆光Schema.org。

八、对Schema.org的信心
Schema书目扩展小组及其建议被采用,会导致书目资源在数据网中更一致、更经常地表达,因之更可发现。如果小组达成其目标,Schema.org将更适合书目资源的通用表达。【基本态度:不管其他人怎么想、其他机构怎么做,反正OCLC就直接用Schema.org了】

参见:
WorldCat也关联数据了(2012年6月21日)
Schema.org的图书馆扩展(2012年6月22日)