书目用RDF词表映射讨论:RDA、BIBFRAME还有ISBD

刚开年,由RDA词表与BIBFRAME映射问题,在BF邮件组中引发了对图书馆界进行中RDF词表的讨论,正反映对RDF词表仍有很多不明与分歧。比如对于用类还是属性,图书馆界资深的RDF专家Karen Coyle称:“某些使用RDF社区似乎非常重类,另一些则不是。许多类还是较少类,会如何影响实践,其含意见对我仍不清楚,但类明显提供我们不常开发的功能”。

回到讨论,问题首先由华盛顿大学的Joseph Kiegel提出:RDA词表(RDA in RDF)有约束版(以WEMI为类)与非约束版,以复制为例,RDA映射到BF后,要再映射回RDA,二种版本都必然导致类的丢失:
rdam:reproductionOfManifestation -> bf:reproduction
rdai:reproductionOfItem -> bf:reproduction
rdau:reproductionOf -> bf:reproduction

当年曾为RDA词表造势的Karen Coyle,近年对图书馆界RDF词表的发展一直持某种异义态度。她在邮件中认为:
RDA、BF及FRBRer以类作为数据结构的决定因素【我的理解是指各自的模型】,是RDF发展中的一个共同错误,因为RDF中并不存在“约束”(constraints),只是可以根据属性的定义域和值域做潜在的推理。只要类没有被声明为互斥(disjoint),被推理的主体作为多个类的实例是不存在冲突的。只有在进行推理时,属性所声明的定义域才起作用。因此,一个大问题是,是否会对所有数据进行推理。例如,RDA类的作用是对三元组范畴做简单的提问,例如“给我有这个ISSN的载体表现的所有作品三元组”。不是这样问题的话,如果定义域不满足需求,可以忽略。
她转而提出另一个问题:我们期望对图书馆的RDF数据执行什么样的操作?这个问题确实应该在对定义域和值域下定义前回答,因为这是其能力的功能。
【思考:先前也曾对各种书目用词表在类定义上的巨大差异感到疑惑,不知道对数据互联会不会有影响。如此看来影响的不是互联,而是推理。按KC提问的例子,推理似乎也只影响其对类的判断。如果这不重要,也就没有多大意义了(继续见下)】

在后面一个邮件中,她举例:
resourceA a bf:Work .
resourceA bf:workTitle “Moby Dick” .
resourceA bf:creator http://..
resource7 a rdac:Work .
resourceA bf:language “ENG” .
resource8 a rdac:Expression .
resource8 rdae:language “ENG” .
resource8 rdae:expressionOf resource3 .
resource3 rdaw:workTitle “Moby Dick” .
resource3 rdaw:personalCreator http://…
上例说明尽管BF和RDA结构不同,但描述相同。她指出:关联数据设计用于跨异质数据,允许差距和分歧,可能不比以前我们所做任何映射更不精确(如MARC到DC,从1100元素集到15)。
【思考:最后一句有点偷换概念,因为原问题是如何实现双向映射。但说明一个问题,即:无须纠结数据丢失,或者这种区别本来就未必造成数据丢失?想想也是,MARC数据并无WEMI区分,但现在根据MARC数据,可以做出FRBR化目录,又有什么必要纠结类还是属性呢?比如title,需要区分实际题名和统一题名,如同author需要区分描述还是规范——用属性还是类都可以实现,在不同RDF词表中转换并不会丢失信息

JSC主席,也是RDA词表、FRBR词表的主导者Gordon Dunsire在邮件组中做了长篇回应。首先从数据质量角度,说明实体类型准确与完整的必要性【即“约束”的作用】。
然后他将话题转回最初问题,即如何在RDA、BF以及FRBR、ISBD间映射。他不认同RDA的W/E等同于BF的作品、RDA的M/I等同于BF的实例。【他提供了他在2014年ALA年会上的一个报告,仅7张PPT,但有图示对此提供了很直观的说明:比如BF的作品对应RDA的E;ISBD/RDF新提出了实现与WEMI映射的元素。虽然其后KC对其中某些观点很不以为然,但PPT仍值得看。见:RDA, MARC and BIBFRAME: transition and interaction / Gordon Dunsire. Presented at LITA/ALCTS MARC Formats Transition Interest Group seminar, ALA 2014, Las Vegas, 28 June 2014.】
他的看法是同时提供非约束元素集,可以在非约束集间实现双向完全映射,他非常期望BF也能这么做。据他介绍:FRBR评审组决定不这么做,因为它计划统一FR模型(现在接近完成),而ISBD评审组会在不远的将来发布其非约束元素集。
他最后指出:我们需要进一步调查RDA/FRBR模型和BF之间的关系,最好由JSC和BF项目实施。【这让我想起不久前,OCLC宣布与LC合作研究BF与Schema.org及其扩展的协调。显然LC没有与如JSC期望的那样,实施BF与RDA间的协调。其间又有多少内幕故事?】


讨论的邮件主题:[BIBFRAME] Constrained vs unconstrained schemas
此组邮件细细看过,没有结论,清理思路而已。

BIBFRAME资源类型与ISBD对照

资源类型在BIBFRAME(以下简称BF)中作为创作作品类的子类,大致相当于以前的一般资料标识(GMD),可对应RDA的内容类型;以前的特殊资料标识(SMD),大致对应RDA载体类型的,将对应于BF的实例类的子类(尚未推出)。

BIBFRAME资源类型(2013.6.25讨论稿)
BIBFRAME Resource Types Discussion Paper (25 June 2013)(2014-2-16访问时为最新版,另有6月17日的版本)

上述讨论稿前部列举了如下4种“当前创作作品类型标准”:
2.1 MARC/MODS(头标06位)
2.2 RDA内容(类型)
2.3 DC资源类型
2.4 Schema.org创作作品子类和产品类型本体,
讨论稿附录则提供了前述两个标准与BF创作作品子类(资源类型)的对照表:
5 RDA对BF
6 DC对BF

讨论稿的“4、建议”中提出14种资源类型:语言资料、地图、数据集、乐谱、舞谱、声音、静态图像、动态图像、三维实物、软件/多媒体、混合资料、合集、手稿、触觉。其中前10种为基本类型。“混合资料”指多种基本类型组成的资料;“合集”指资源的集合,可与前11种类型一起使用;“手稿”和“触觉”属限定类型,必须与前面的类型合用(组配)。

RDA纯列举式的23种内容类型相比,BF因采用组配方式而大大减少了数量。这种组配方式,与ISBD第0项的内容类型由“内容形式+内容限定”组合而成有一定的相似性。这也是我比较喜欢的方式。
ISBD的内容形式仅11种,再加“其他内容形式”,在数量上与BF比较接近。只是美国的编目相关标准,似乎向来无视IFLA的ISBD,在建议稿中根本没有提及。只好自己动手做一个BF到ISBD的对照,了解两者的异同。
对照下来看,BF的资源类型还可以再做些精简——比如可以如ISBD直接用“图像”,或者如“音频”把“静态图像/动态图像”当作子类,或者如ISBD把“动态/静态”像“触摸”一样作为组配。

———BF资源类型与ISBD内容形式/内容限定对照———
语言资料 Language material(书写或讲述形式,子类:book, journal, legislation, newspaper, article, letter, dissertation)——ISBD内容形式 Text 或 Spoken word
附注:BF的“语言资料”比ISBD的“文本”(只包含书写)范围广,电子书可用“语言资料”+“音频”(子类spoken word)?
地图 Cartography——ISBD内容限定-类型 Cartographic
附注:ISBD属“限定”,需与“内容类型”配合使用。用词上,BF特别说明与其他类型一样用名词,不用形容词“Cartographic”
数据集 Dataset——ISBD内容形式 Dataset
附注:完全相同
乐谱 Notated music——ISBD内容形式 Music + 内容限定-类型 Notated
附注:ISBD的Music包括乐谱和实际的音乐,比BF泛指
舞谱 Notated movement——ISBD内容形式 Movement + 内容限定-类型 Notated
音频 Audio(子类:musical, nonmusical, sounds, spoken word)——ISBD内容形式 Music + 内容限定-类型 Performed;Sounds;Spoken word)
附注:BF用泛指的“音频”包括音乐、言谈与其他声音
静态图像 Still image——ISBD内容形式 Image + 内容限定-运动:Still
附注:ISBD用Image包括静态图像和动态图像,比BF泛指
动态图像 Moving image(子类:two-dimensional, three-dimensional)——ISBD内容形式 Image + 内容限定-附注:运动 Moving,+ 内容限定-维度 2-dimentional/3-dimentional
三维实物 Three dimensional object——ISBD内容形式 Object
附注:用词略有不同
软件/多媒体 Software/multimedia——ISBD内容形式 Program
附注:用词不同
混合资料 Mixed material——ISBD内容形式 Multiple content forms
附注:用词不同
合集 Collection
附注:ISBD无对应。此类型似乎与前11种不属同一层次。
手稿 Manuscript(配合前述类型用)
附注:ISBD无对应。现在才想到,ISBD与RDA竟然都没有“手稿”这个非常重要的类型
触觉 Tactile(配合前述类型用)——ISBD内容限定-感官 Tactile
附注:用法相同

ISBD与RDA的对照

以前看ISBD与RDA的元素对照,用的是RDA附录D.1。自己做过RDA内容类型、媒介类型、载体类型与ISBD第0项等的对照表。看到书蠹精介绍国际图联网站发布RDA和ISBD之间的对应关系表和说明,依链接前往ISBD网站一观。在“Documentation”部分,除ISBD2011统一版外,目前有4个与RDA相关的文件,分别是:

* ISBD Profile in RDA: Constructing Functionally Interoperable Core Records, Version 1.0 / Prepared by Massimo Gentili-Tedeschi, Françoise Leresche, Dorothy McGarry and Elena Escolano Rodríguez (chair) [update 2014-2-17:即6JSC/ISBD/Discussion/3]
《RDA中的ISBD概况:构造功能性互操作核心记录(1.0版)》,2013年11月编目部常务委员会批准。最初由法国标准协会的法国采用RDA技术小组(AFNOR Groupe technique sur l’adoption de RDA en France)准备。
本文档以表格形式对照ISBD必备(mandatory)元素条款(stipulation)与RDA核心(core)元素条款(instruction),含两个规则的条款号、元素名称和规定文本,并有ISBD评审组的点评,在两种规则不一致或RDA有选项时的推荐用法。ISBD采用的是2011统一版,RDA采用的是2013年5月更新网络版。
如果想快速了解ISBD与RDA的差异,看点评部分(表格第3栏)相当方便。

* Alignment of the ISBD: International Standard Bibliographic Description element set with RDA: Resource Description & Access element set, Version 1.1 / Gordon Dunsire and IFLA Cataloguing Section’s ISBD Review Group (附讨论稿,即6JSC/ISBD/Discussion/1,September 25, 2012)
《ISBD元素集与RDA元素集校准(1.1版)》,2012年9月编目部常务委员会批准。
本文档是所有ISBD元素与RDA元素的对照表,含两个规则的元素名称、条款号、定义;也包括RDA附录J的关系说明语。ISBD采用的是2011统一版,RDA采用的是2010年印刷本。
比较特别的是还标明两种元素的对应程度,即ISBD元素的定义与范围是小于(<)、大于(>)还是等于(=)RDA元素,基于对定义、范围注释、其他文本及样例的细致的分析,有助于快速了解ISBD与RDA的异同。其作用当然不止于此,文档导论中说明,还可用于对开放元数据注册(OMG)中两种元素集的RDF表达对映射,用诸如“subPropertyOf”表达。
[update 2015-2-25: Version 3.1 (2015-2-17),根据2015年2月RDA工具包发布元素更新,对照表去掉了ISBD元素定义,RDA分为有实体(WEMI)和非约束2部分,均标URI(如P1001、P60049)]
注:Gordon Dunsire自2014起任JSC主席。他是IFLA分编领域的活跃人物,任ISBD评估组与语义网界的联络人(当时在苏格兰Strathclyde大学任职),还承担在OMG上注册FRBR、ISBD、UNIMARC系列元素集

* Mapping of ISBD area 0 vocabularies to RDA/ONIX Framework vocabularies, Version 1.1 / Gordon Dunsire and IFLA Cataloguing Section, ISBD Review Group’s ISBD/XML Study Group(途径称ISBD2ROF Mapping。附讨论稿,即6JSC/ISBD/Discussion/2,September 25, 2012)
《ISBD第0项词汇与RDA/ONIX框架词表对照表(1.1版)》,2012年9月编目部常务委员会批准。
本文档由ISBD第0项词汇对照ROF的特性(Character)、感官模式(Sensory Mode)、图像运动(Image movement)和图像维度(Image dimensionality),包括词汇与定义。包含5个表:
表1. 内容形式(Content form)
表2. 感官说明的内容限定(Content qualification of sensory specification)
表3. 运动的内容限定(Content qualification of motion)
表4. 维度的内容限定(Content qualification of dimensionality)
表5. 媒介类型(Media type)
另:类型的内容限定(Content qualification of type)没有适用的对照表

* Mapping of RDA Content Types to ISBD Content Forms and Media Types
《RDA内容类型与ISBD内容形式与媒介类型对照表》
RDA表6.1(在RDA6.9.1.3)内容类型与ISBD内容形式、内容限定及媒介类型(明确的情况下)的对照。本文档是HTML页面,说明是临时性的,最后更新日期2012年10月5日。前几个都是由ISBD对照到RDA等,本文档由RDA对照到ISBD。
与RDA内容类型定组不同,ISBD是由内容形式与内容限定后组而成的。某些内容类型只针对特定的媒介类型。如:
RDA内容类型:cartographic dataset
ISBD内容形式(内容限定-类型):媒介类型:dataset (cartographic) : electronic

via 书蠹精:RDA中的ISBD概要发布 (2014-01-16)

[update 2014-1-23]新增相关文件:
* Alignment of the ISBD: International Standard Bibliographic Description element set with RDA: Resource Description & Access element set and REICAT: Regole italiane di catalogazione
Mappatura tra le entità logiche di ISBD, RDA e REICAT / REICAT to the ISBD/RDA alignment prepared by Simone Forassiepi, University of Florence, Italy under the supervision of Professor Mauro Guerrini
《ISBD、RDA及《意大利编目规则》实体逻辑对照》
本文档是在《ISBD元素集与RDA元素集校准(1.1版)》基础上,生成的《意大利编目规则》(REICAT)元素集与ISBD/RDA元素集的对照,正文为意大利文。目的在于促进由ISBD、RDA、REICAT三种规则生产的数据间协调的讨论。

[update 2014-2-17]JSC网站2月15日发布JSC与ISBD评审组工作的两个文件:
– 6JSC/Chair/13 协议
Protocol between the JSC and the ISBD Review Group / Gordon Dunsire, Chair, JSC(14 February 2014)
JSC与ISBD评审组之间的协议,包括背景、目的、方法、双方的职责。
目的:支持维护和开发,使采用RDA和ISBD所创建数据间的功能互操作。
JSC将任命一个咨询联络人到ISBD评审组;ISBD评审组将任命一个代表到JSC RDA/ONIX框架工作组。
– 6JSC/Chair/13/Shared documents 共享文件
Documents shared between the JSC and the ISBD Review Group / Gordon Dunsire, Chair, JSC(14 February 2014)
对照列出ISBD评审组版和JSC版文件(链接),“共享文件”主要是上述4种,另外还有5种“背景文件”。