FRBR、RDA和BIBFRAME词表的RDF推理测试

有关新兴的书目RDF词表的正式论文不多见。因此当看到远洋老师在书社会Keven日志的评论中推荐此文时,马上下载,然后花了几个晚上阅读、消化此文,对RDF词表有了与先前不同的理解。

《语义网中资源描述的多实体模型:FRBR、RDA和BIBFRAME比较》
Baker, T., Coyle, K., & Petiya, S. (2014). Multi-entity models of resource description in the Semantic Web: A comparison of FRBR, RDA, and BIBFRAME. Library Hi Tech, 32(4), 562-582. doi:10.1108/LHT-08-2014-0081 (Preprint)

原文摘要:新兴图书馆标准中,书目描述正采用多实体模型,描述从概念性作品到物理单件的不同抽象层。其中三个已发布为使用语义网标准RDF的词表:FRBR、RDA和BIBFRAME。作者使用通用的语义网可用软件,测试了基于这三个词表的RDF数据。分析证明,这些模型意图的数据结构不被RDF词表支持。在某些情况下,这导致词表间不受欢迎的不兼容,在Web的开放数据环境中对互操作是一种损害。

文章含脚注及参考文献共18页(期刊版20页),读完后对文章概要、一些基本概念及作者的观点备注如下(有时很难分清是作者观点还是基本概念):
1、文章概要
文章分别使用FRBR、RDA和BIBFRAME词表,设计若干非正统数据样例,用RDF推理机测试,结果表明(FRBR词表)类的互斥会造成问题,而(RDA和BIBFRAME词表)属性与类的非一对一“错误”并未被检测出来(换言之虽不符合词表定义及其校验目的,但未影响到实际使用)。文章没有直接做三种词表的比较。
2、关于RDF词表
(1)RDF类不定义属性;RDF属性独立于类,原则上可用于描述任何类的实例。
(2)基于推导的RDF语义在本质上是提供(增加)信息的。RDF定义域声明允许推理机简单推导:以一个属性描述的资源,也是该定义域类的成员。
(3)OWL公理(类成员、基数、互斥)不是数据检验约束。RDF类不支持数据结构校验。新兴的RDF检验方法会在RDF词表本身之外表达这些约束。
3、关于书目RDF词表
(1)目前的多实体书目模型的RDF词表,概念化书目事物(thing)为属于不同RDF类的资源集。
(2)FRBR定义类互斥。当描述类的实例的数据必须与描述完全不同类的实例的数据集成时,互斥会造成问题。
(3)定义的约束越少,RDF词表越可重用。从质量控制需求,对书目数据的校验约束应该采用应用纲要等方法,独立于词表表达。

ISBD与FRBR之间的语义关系

书蠹精微博提示ISBD与RDA协调有更新,前往ISBD评审组网站一看。发现《ISBD元素集与RDA元素集校准》由1.1版升级为3.1版(参见:2014年1月17日的“ISBD与RDA的对照”)。

又看到不知什么时候,ISBD评审组网站上发布了2013年由Gordon Dunsire完成的报告(自称paper),关于ISBD与FRBR之间的语义关系:Resource (ISBD) and Work, Expression, Manifestation, Item (FRBRer) semantic relationship

Resource and Work, Expression, Manifestation, Item / Gordon Dunsire, 28 July 2013. Amended 6 October 2013, following comments by Patrick Le Boeuf and discussion at IFLA 2013

ISBD是不分FRBR层次的,在此报告中作为“资源”,与FRBR的WEMI一同作为“类”(表1);
WEMI之间的关系(属性),由WEMI分别作为定义域和值域(表2);
资源与WEMI之间的关系,则分别由资源和WEMI作为定义域和值域(表3)。

说到底,这种表有什么用呢?
文中提出了两个案例:
1、由遗留书目记录发布关联数据
2、集成基于FRBR的元数据

当初ISBD做统一版时,没有采用FRBR模型。未来根据不同模型、由不同RDF词表生成数据之间的对照,会是关注的热点。

FRBR模型缺了什么?

俄勒岗大学Kelley McGrath在BIBFRAME邮件组中针对影视作品提问:MARC中缺了什么([BIBFRAME] What’s missing in MARC),BIBFRAME是否对MARC这方面不足做过什么分析,是否会加以支持?他提出的问题之一是关联演员人名与角色人名。这确实是个用户很关心的关系,某个角色是谁演的、谁配音的,可以从角色查到演员或反之……
没人回答这个问题。我想了下,觉得这不单是MARC的问题,因为FRBR模型中也没有揭示这种关联:
1、角色应当属于主题范畴。习惯上那些最著名的角色会作为被描述的虚拟人物(个人名称主题)被揭示。
2、只有第1组实体中的作品有主题。
3、影视作品演员属于贡献者,贡献者对应于内容表达。
结论:影视作品演员与虚拟人物之间的关系,是内容表达的责任者与作品的主题之间的关系——在FRBR模型中,没有揭示两者间关系。

FRBR实体关系
(此图链接自W3C图书馆关联数据小组档案,原图出自:FRBR: A Generalized Approach to Dublin Core Application Profiles / Maja Zumer, Marcia Lei Zeng, Athena Salaba)

Kelley McGrath在邮件中提到一个众包项目:影视演职员表标注实验OLAC Movie & Video Credit Annotation Experiment
好奇去贡献了几个标注,然后看了下这个项目介绍,发现是“一个更大探索的一部分,即借助FRBR模型及分面搜索,改进图书馆和档案馆拥有的动态图书馆资料的检索”。而其中工作之一、Kelley McGrath作为主席的“动态图像作品级记录工作组”(Moving Image Work-Level Records Task Force),做的正是与FRBR相关的工作:

“工作组调查,并就动态图像资料的基于FRBR作品级记录相关问题提出建议。包括:
– 动态图像作品的识别特征
– 识别这些特征的潜在信息源,检查这些来源的可靠性
– 检查现有书目记录,识别作品级信息可以记录的位置,调查从现有书目记录中抽取信息创建临时作品级记录的可能性”

工作组在2009年提出了《动态图像作品建议报告》:
第1部分“动态图像作品的定义与边界”。作品与内容表达的分界线一直是令我困惑的问题。报告此部分一开始就说明FRBR本身就认为这是个很难的问题……没有认真看下去(让我想起大专辩论赛、首先辩论的不是论题,而是论题本身的含义)。
第2部分“核心属性和关系”的“建议属性和关系”中,有“角色”(Characters portrayed (fictional and dramatic works))(p.15)。
假设工作组放宽条件,把某部电影当作作品,演员与作品产生关联;不同语种版本自然是内容表达,还是有配音演员与角色(也就是作品主题)的关系问题。凌乱中……

联想到JSC在2014年11月举行的RDA年度会议上说要开发新的附录M主题关系说明语。RDA原有附录L“概念、实物、事件和地点间关系”,指的是第3组实体内部关系(目前仍为空白)。附录M则是针对“一部作品”与其主题之间的关系,会有哪些关系呢?首先肯定得增加时间(FRBR第3组实体中没有时间是很奇怪的事情),那么能解决角色与演员之间的关系吗?

——或者换个角度,这种关系的揭示,是书目元数据标准该解决的吗?是否应该直接采用某种影视作品本体?