FRBR、RDA和BIBFRAME词表的RDF推理测试

有关新兴的书目RDF词表的正式论文不多见。因此当看到远洋老师在书社会Keven日志的评论中推荐此文时,马上下载,然后花了几个晚上阅读、消化此文,对RDF词表有了与先前不同的理解。

《语义网中资源描述的多实体模型:FRBR、RDA和BIBFRAME比较》
Baker, T., Coyle, K., & Petiya, S. (2014). Multi-entity models of resource description in the Semantic Web: A comparison of FRBR, RDA, and BIBFRAME. Library Hi Tech, 32(4), 562-582. doi:10.1108/LHT-08-2014-0081 (Preprint)

原文摘要:新兴图书馆标准中,书目描述正采用多实体模型,描述从概念性作品到物理单件的不同抽象层。其中三个已发布为使用语义网标准RDF的词表:FRBR、RDA和BIBFRAME。作者使用通用的语义网可用软件,测试了基于这三个词表的RDF数据。分析证明,这些模型意图的数据结构不被RDF词表支持。在某些情况下,这导致词表间不受欢迎的不兼容,在Web的开放数据环境中对互操作是一种损害。

文章含脚注及参考文献共18页(期刊版20页),读完后对文章概要、一些基本概念及作者的观点备注如下(有时很难分清是作者观点还是基本概念):
1、文章概要
文章分别使用FRBR、RDA和BIBFRAME词表,设计若干非正统数据样例,用RDF推理机测试,结果表明(FRBR词表)类的互斥会造成问题,而(RDA和BIBFRAME词表)属性与类的非一对一“错误”并未被检测出来(换言之虽不符合词表定义及其校验目的,但未影响到实际使用)。文章没有直接做三种词表的比较。
2、关于RDF词表
(1)RDF类不定义属性;RDF属性独立于类,原则上可用于描述任何类的实例。
(2)基于推导的RDF语义在本质上是提供(增加)信息的。RDF定义域声明允许推理机简单推导:以一个属性描述的资源,也是该定义域类的成员。
(3)OWL公理(类成员、基数、互斥)不是数据检验约束。RDF类不支持数据结构校验。新兴的RDF检验方法会在RDF词表本身之外表达这些约束。
3、关于书目RDF词表
(1)目前的多实体书目模型的RDF词表,概念化书目事物(thing)为属于不同RDF类的资源集。
(2)FRBR定义类互斥。当描述类的实例的数据必须与描述完全不同类的实例的数据集成时,互斥会造成问题。
(3)定义的约束越少,RDF词表越可重用。从质量控制需求,对书目数据的校验约束应该采用应用纲要等方法,独立于词表表达。