OCLC对BIBFRAME和Schema.org书目扩展的立场

2013年6月,OCLC研究部发布了一个关于BIBFRAME和Schema.org书目扩展模型关系的工作文件:
The Relationship between BIBFRAME and the Schema.org ‘Bib Extensions’ Model: A Working Paper / Carol Jean Godby. Dublin, Ohio: OCLC Research, 2013. (pdf,41页)
文件第2部分详述OCLC主导的Schema.org书目扩展SchemaBibEx,认为已足够成熟,可以用于WorldCat关联数据标记的下一次更新。据称按计划2013年下半年公布,不料因未得到(SchemaBibEx小组)认同,直到一年后的上个月底,WorldCat关联数据标记还是老样子(这几天发现略有变化,出现了bgn:命名空间属性)。
文件第4部分的表4.1“SchemaBibEx和BIBFRAME未来开发中参与的职责”,列出了SchemaBibEx与BIBFRAME合作,以及两方面各自在建模、各方参与、细化、映射和演示5个方面的活动,可从中看OCLC在SchemaBibEx方面打算做的工作。表中BIBFRAME主导的主要是与MARC有关的,而双方合作及SchemaBibEx主导的与BIBFRAME有关的工作是:
活动1、建模,合作:建模关键概念,包括FRBR第1组实体、收藏集(collection)、丛编和馆藏(Holding)。
活动3、细化,合作:确保概念的关联数据友好的。
活动4、映射,合作:协调不一致。
SchemaBibEx主导:映射BIBFRAME概念到Schema.org
活动5、演示,合作:协调不一致;演示附加效果。
SchemaBibEx主导:开发并公开SchemaBibEx模型的实施和BIBFRAME衍生。

可以说,文件表明了OCLC发展SchemaBibEx的决心及计划。即使现在OCLC以BiblioGraph.net(bgn:)代替了SchemaBibEx,扩展Schema.org的决心与计划并未改变。
本工作报告是OCLC关联数据研究(OCLC Linked Data Research)活动的一部分。本月初OCLC在网站发布新闻,宣布和LC共同澄清图书馆关联数据方法,也可以说再次表明了自己的立场:
OCLC and the Library of Congress — working together to clarify approaches to library linked data (04 December 2014)
双方的合作始于2014年8月,9月联合技术会后每月沟通。讨论论题包括:
§ BIBFRAME试验记录的结构与内容
§ WorldCat馆藏使用案例
§ BIBFRAME和SchemaBibExtend词表的异同
双方将同撰写一份白皮书,澄清如何组装两种方法以表达图书馆的特定需求与挑战。
在下月举行的ALA 2015仲冬会议上将会有相关活动。

———-关于“Schema.org书目扩展”的八卦———-
去年6月时Godby在BIBFRAME邮件组中发布文件上线消息。本想看完文件后写一篇OCLC对BF态度的博文,不料由于BF邮件组中的讨论,吸引力被引向了Schema书目扩展的进展,最后就把写博的事忘了。
作为W3C的Schema书目扩展小组的成员,Karen Coyle首先对报告述及的“重新设计的主要目标是使用已在Schema.org中定义的概念改进FRBR等级表达”(p.11)提出异议,认为这是OCLC的想法,小组“未在此点上取得一致,未以在schema.org中表达FRBR为目标”。其后Coyle在另一个回复中更指出,“报告中把很多实则来自OCLC的想法错误地归因于schemaBibEx小组”。
原定一年的Schema书目扩展活动到2014年2月为时一年半,仍未取得多少成果,想来原因正在于OCLC与小组其他成员在不少问题上未能取得一致。OCLC及此项目负责人Richard Wallis对成立这个小组的决定大概很郁闷,因之在4月另起炉灶,注册BiblioGraph.net网站,以bgn:命名空间继续扩展Schema.org之路。

参见:
解惑Schema书目扩展(2014年1月29日)
WorldCat作品关联数据问答(2014年3月7日)
问题之一:WorldCat作品如何与BIBFRAME模型形成交集?
OCLC低调注册BiblioGraph.net扩展Schema.org(2014年12月1日)

NLM将试验BIBFRAME+RDA元素

美国国会图书馆(LC)近年正开发BIBFRAME(BF)以取代MARC。只是环境已然改变,在去中心化的时代,BF是否能如MARC那般一统江湖,恐怕不容乐观。
首先就有OCLC特立独行。由于在BF开发前OCLC就已采用schema.org发布其WorldCat书目关联数据,因而坚持扩展Schema.org之路。虽然OCLC也是BF早期实验的七个参与者之一,但对自己的定位只是映射BF概念到Schema.org,而不是采用BF。今年OCLC更注册了BiblioGraph.net网站,以bgn命名空间用作schema.org书目扩展(参见:OCLC低调注册BiblioGraph.net扩展Schema.org,2014年12月1日)。
现在,又一个BF早期实验参与者——美国国家医学图书馆(NLM),作为BF开发活动的重度参与者,表示不赞同BF目前的开发方向,并将有所行动。

在BF开发过程中,对它完全没有遵循RDF重用其他URI的建议自然有不同看法。曾见到对BIBFRAME必要性的质疑:既然采用RDF,为什么不以Profile形式,而要自己定义完整的BF词表?为什么不直接采用RDA元素?(出处暂缺[update 2014-12-3,见于2014年7月BIBFRAME邮件组针对“BF vocabulary and RDA”的讨论],在其FAQ中可以看到LC对此问题的解释)
如今,美国国家医学图书馆(NLM)站出来,表明自己反对完整BF词表的立场。11月21日,Nancy Fallgren代表NLM的BF实验团队,在BIBFRAME邮件组发送贴子,说明NLM将在2015年采用Profile方式,以一个BF“核心词表”+RDA注册元素(扩展)+NLM词表进行实验。这无疑是现在见到的最重量级、行动性的质疑了。
消息发布后,在BF邮件组中引起包括Karen Coyle在内若干人的审慎关注,希望NLM能够公开资料,目前来说,对其所称通用的“核心BF词表”尤其感兴趣。
Nancy Fallgren表示未来他们会在该邮件组共享比如纲要草案(a draft profile),也在考虑设立一个独立网站,现在的目标是该模型在约2015年春能够以草案方式开始生成描述

———-附邮件译文:BIBFRAME experimentation at NLM———-
从早期实验者到当前实施者,NLM一直与LC合作BF的开发与实验。BF的最初目标(基于书目控制未来工作组及美国RDA测试协调委员会的建议)是开发一个数据共享标准以取代MARC,基于Web、灵活、可扩展到传统图书馆编目领域之外(即规则无关[不可知])。但是,如过去几年来NLM已经实验的BF,我们高度关注到,词表发展试图足以与传统书目编目校准,可能阻碍着满足所有BF目标,尤其是其灵活性和扩展性。

作为这一关注的结果,NLM决定从LC生产的当前实验词表向后退一步,实验BF更“模块化的”方法。在BF早期实验者中,简单发布过一个BF模块化方法的想法,我们有一个核心BF词表,足够通用,可由所有文化遗产界共享。这样一个核心BF词表被建议可由文化遗产界不同部门开发的现有描述规范扩展……。在这一模型中,随着一个描述规范改变或进化或被取代,对BF的扩展可相应改变,一旦需要调整到BF核心词表的映射时,核心词表本身不应当受到严重影响,如果有影响的话。

NLM试图实验这样的模型(我们将其特点当作“模块化的”,但用BF来说,可视为规范定义纲要[a schema-defined profile])。我们相信,一个成功的概念验证将证明,一个BF模型和词表可以满足所有BF初始目标。我们试图为实验起草一个核心BF词表(我们完全理解,一个切实可行的核心词表需要许多社群的协作,但我们需要开始做些事),用RDA扩展它(使用RDA注册元素),并以一个NLM词表用于本地数据。我们的意图是关注于以此模型生成新数据,但也将实验转换遗留数据。

NLM继续与LC在BF开发上合作,在2015年我们各自并行实验时,并意图与LC定期开会共享我们的发现。

代表NLM的BF实验团队
-Nancy Fallgren

基于BIBFRAME的上海图书馆家谱本体发布

今年6月,夏MM在“数字人文与语义技术”(2014年图书馆前沿技术论坛)上做了《以书目框架建模的上图家谱知识库系统》的报告,介绍上海图书馆已经用BIBFRAME构建了家谱本体。
昨天(11月21日),上海图书馆在网站上[(update 2014-11-23)以关联数据形式]发布了基于BIBFRAME的家谱本体,目前为第一版(V1.0):
上海图书馆家谱本体:http://gen.library.sh.cn

网站长得和BIBFRAME词表很像,也提供了类似的模型视图、类视图和列表视图三种浏览模式。不过,在可视化及浏览导航上,比bibframe.org对人的可用性要好,有助于从整体上快速了解该本体:
– 模型视图:提供了5个类(核心类?)的可视化图示,分别是:
BF的作品Work、实例Instance、拥有单件HeldItem
自定义的家族Family、个人Person
– 类视图:左侧以等级方式展开所有类,包括:
BF类17个(除顶级类bf:Resource)
自定义shlgen类5个

当然比形式更值得关注的是内容,尤其是针对家谱资源的扩展内容。从类视图看,扩展的5个类(及属性)分别是:
(1)bf:Family的子类shlgen:Family(包括属性:始祖、支祖、始迁祖、名人、散居地)
(2)bf:Person的子类shlgen:Person(包括属性:字、名、行、号、家族、迁徙、时代)
(3)bf:Event的子类shlgen:Event
(4)shlgen:Event的子类shlgen:Migration(包括属性:原居地、迁居地)
(5)shlgen:FamilyName(包括属性:姓氏值)
扩展同名子类(而不是直接采用BF类)的目的,是要定义家谱独特的属性(见上)或类(迁徙事件)。
据了解,设置顶级类shlgen:FamilyName(姓氏),是为了未来扩展更多(超出家谱资源本身的)属性,比如姓氏的发源地、变迁等。

从列表视图看,上图家谱本体的类与属性的数量是:
– 类(Class):23个 = 18个BF类 + 5个shlgen类
– 属性(Property):49个 = 31个BF属性 + 2个FOAF属性 + 16个 shlgen属性(“事件”目前未出现在类视图中)

参见:
Bibframe.org的类与属性发布(2014年1月27日)
当时BIBFRAME定义了52个类、266个属性

数字人文 vs 电子科学(“数字人文与语义技术”会议报告随记)(2014年6月20日)

[update 2014-11-23] 网站的“发布说明”对该本体做了介绍(见下),右侧栏还有相关的论文及会议报告链接(Publications & Presentations(资料)),目前有如下三个:
– 刘炜,夏翠娟:《书目数据新格式BIBFRAME及其应用》大学图书馆学报,2014,1
– 夏翠娟:以书目框架建模的上图家谱知识库系统
– 夏翠娟,刘炜,张磊,朱雯晶:《基于书目框架(BIBFRAME)的家谱本体设计》图书馆论坛,2014,11

———-上海图书馆家谱本体第一版(V1.0)发布说明(全文抄录)———-
上海图书馆家谱本体是上海图书馆家谱知识库系统的前期成果,是为了更深入地对上海图书馆丰富的家谱馆藏资源进行基于内容的深度加工而设计的本体模型,包括一套术语词表。本体模型基于书目框架(BIBFRAME)而设计,词表也复用了BIBFRAME和FOAF的某些术语,同时根据家谱的特殊性自定义了少量术语。复用自BIBFRAME的术语前缀为bf,如bf:Work,自定义的术语前缀为shlgen,如shlgen:Person。

上海图书馆家谱本体此次在本网站发布的是第一版(V1.0),随着家谱数据的处理和家谱知识库系统建设的进一步深化,将来会进一步扩展。

本网站对上海图书馆家谱本体的发布采用了关联数据技术,遵循关联数据的四原则。
术语均赋予了URI,如http://gen.library.sh.cn/vocab/Person。
实现内容协商,如用普通的浏览器访问http://gen.library.sh.cn/vocab/Person,系统将返回Html页面,当用语义浏览器或语义代理(程序)访问http://gen.library.sh.cn/vocab/Person,系统返回关于Person的RDF/XML数据。 用W3C的RDF Validator可以体验。

本网站提供三种视图模式供用户浏览: 模型视图(Model View)、 类视图(Class View)和 列表视图(List View)。
模型视图(Model View):可视化地展示了家谱本体类和属性间的关系。
类视图(Class View):通过父类和子类的层级关系浏览类和属性。
列表视图(List View):按照类和属性名的首字母顺序排列展示类和属性。