ISBD与FRBR之间的语义关系

书蠹精微博提示ISBD与RDA协调有更新,前往ISBD评审组网站一看。发现《ISBD元素集与RDA元素集校准》由1.1版升级为3.1版(参见:2014年1月17日的“ISBD与RDA的对照”)。

又看到不知什么时候,ISBD评审组网站上发布了2013年由Gordon Dunsire完成的报告(自称paper),关于ISBD与FRBR之间的语义关系:Resource (ISBD) and Work, Expression, Manifestation, Item (FRBRer) semantic relationship

Resource and Work, Expression, Manifestation, Item / Gordon Dunsire, 28 July 2013. Amended 6 October 2013, following comments by Patrick Le Boeuf and discussion at IFLA 2013

ISBD是不分FRBR层次的,在此报告中作为“资源”,与FRBR的WEMI一同作为“类”(表1);
WEMI之间的关系(属性),由WEMI分别作为定义域和值域(表2);
资源与WEMI之间的关系,则分别由资源和WEMI作为定义域和值域(表3)。

说到底,这种表有什么用呢?
文中提出了两个案例:
1、由遗留书目记录发布关联数据
2、集成基于FRBR的元数据

当初ISBD做统一版时,没有采用FRBR模型。未来根据不同模型、由不同RDF词表生成数据之间的对照,会是关注的热点。

书目用RDF词表映射讨论:RDA、BIBFRAME还有ISBD

刚开年,由RDA词表与BIBFRAME映射问题,在BF邮件组中引发了对图书馆界进行中RDF词表的讨论,正反映对RDF词表仍有很多不明与分歧。比如对于用类还是属性,图书馆界资深的RDF专家Karen Coyle称:“某些使用RDF社区似乎非常重类,另一些则不是。许多类还是较少类,会如何影响实践,其含意见对我仍不清楚,但类明显提供我们不常开发的功能”。

回到讨论,问题首先由华盛顿大学的Joseph Kiegel提出:RDA词表(RDA in RDF)有约束版(以WEMI为类)与非约束版,以复制为例,RDA映射到BF后,要再映射回RDA,二种版本都必然导致类的丢失:
rdam:reproductionOfManifestation -> bf:reproduction
rdai:reproductionOfItem -> bf:reproduction
rdau:reproductionOf -> bf:reproduction

当年曾为RDA词表造势的Karen Coyle,近年对图书馆界RDF词表的发展一直持某种异义态度。她在邮件中认为:
RDA、BF及FRBRer以类作为数据结构的决定因素【我的理解是指各自的模型】,是RDF发展中的一个共同错误,因为RDF中并不存在“约束”(constraints),只是可以根据属性的定义域和值域做潜在的推理。只要类没有被声明为互斥(disjoint),被推理的主体作为多个类的实例是不存在冲突的。只有在进行推理时,属性所声明的定义域才起作用。因此,一个大问题是,是否会对所有数据进行推理。例如,RDA类的作用是对三元组范畴做简单的提问,例如“给我有这个ISSN的载体表现的所有作品三元组”。不是这样问题的话,如果定义域不满足需求,可以忽略。
她转而提出另一个问题:我们期望对图书馆的RDF数据执行什么样的操作?这个问题确实应该在对定义域和值域下定义前回答,因为这是其能力的功能。
【思考:先前也曾对各种书目用词表在类定义上的巨大差异感到疑惑,不知道对数据互联会不会有影响。如此看来影响的不是互联,而是推理。按KC提问的例子,推理似乎也只影响其对类的判断。如果这不重要,也就没有多大意义了(继续见下)】

在后面一个邮件中,她举例:
resourceA a bf:Work .
resourceA bf:workTitle “Moby Dick” .
resourceA bf:creator http://..
resource7 a rdac:Work .
resourceA bf:language “ENG” .
resource8 a rdac:Expression .
resource8 rdae:language “ENG” .
resource8 rdae:expressionOf resource3 .
resource3 rdaw:workTitle “Moby Dick” .
resource3 rdaw:personalCreator http://…
上例说明尽管BF和RDA结构不同,但描述相同。她指出:关联数据设计用于跨异质数据,允许差距和分歧,可能不比以前我们所做任何映射更不精确(如MARC到DC,从1100元素集到15)。
【思考:最后一句有点偷换概念,因为原问题是如何实现双向映射。但说明一个问题,即:无须纠结数据丢失,或者这种区别本来就未必造成数据丢失?想想也是,MARC数据并无WEMI区分,但现在根据MARC数据,可以做出FRBR化目录,又有什么必要纠结类还是属性呢?比如title,需要区分实际题名和统一题名,如同author需要区分描述还是规范——用属性还是类都可以实现,在不同RDF词表中转换并不会丢失信息

JSC主席,也是RDA词表、FRBR词表的主导者Gordon Dunsire在邮件组中做了长篇回应。首先从数据质量角度,说明实体类型准确与完整的必要性【即“约束”的作用】。
然后他将话题转回最初问题,即如何在RDA、BF以及FRBR、ISBD间映射。他不认同RDA的W/E等同于BF的作品、RDA的M/I等同于BF的实例。【他提供了他在2014年ALA年会上的一个报告,仅7张PPT,但有图示对此提供了很直观的说明:比如BF的作品对应RDA的E;ISBD/RDF新提出了实现与WEMI映射的元素。虽然其后KC对其中某些观点很不以为然,但PPT仍值得看。见:RDA, MARC and BIBFRAME: transition and interaction / Gordon Dunsire. Presented at LITA/ALCTS MARC Formats Transition Interest Group seminar, ALA 2014, Las Vegas, 28 June 2014.】
他的看法是同时提供非约束元素集,可以在非约束集间实现双向完全映射,他非常期望BF也能这么做。据他介绍:FRBR评审组决定不这么做,因为它计划统一FR模型(现在接近完成),而ISBD评审组会在不远的将来发布其非约束元素集。
他最后指出:我们需要进一步调查RDA/FRBR模型和BF之间的关系,最好由JSC和BF项目实施。【这让我想起不久前,OCLC宣布与LC合作研究BF与Schema.org及其扩展的协调。显然LC没有与如JSC期望的那样,实施BF与RDA间的协调。其间又有多少内幕故事?】


讨论的邮件主题:[BIBFRAME] Constrained vs unconstrained schemas
此组邮件细细看过,没有结论,清理思路而已。

BIBFRAME资源类型与ISBD对照

资源类型在BIBFRAME(以下简称BF)中作为创作作品类的子类,大致相当于以前的一般资料标识(GMD),可对应RDA的内容类型;以前的特殊资料标识(SMD),大致对应RDA载体类型的,将对应于BF的实例类的子类(尚未推出)。

BIBFRAME资源类型(2013.6.25讨论稿)
BIBFRAME Resource Types Discussion Paper (25 June 2013)(2014-2-16访问时为最新版,另有6月17日的版本)

上述讨论稿前部列举了如下4种“当前创作作品类型标准”:
2.1 MARC/MODS(头标06位)
2.2 RDA内容(类型)
2.3 DC资源类型
2.4 Schema.org创作作品子类和产品类型本体,
讨论稿附录则提供了前述两个标准与BF创作作品子类(资源类型)的对照表:
5 RDA对BF
6 DC对BF

讨论稿的“4、建议”中提出14种资源类型:语言资料、地图、数据集、乐谱、舞谱、声音、静态图像、动态图像、三维实物、软件/多媒体、混合资料、合集、手稿、触觉。其中前10种为基本类型。“混合资料”指多种基本类型组成的资料;“合集”指资源的集合,可与前11种类型一起使用;“手稿”和“触觉”属限定类型,必须与前面的类型合用(组配)。

RDA纯列举式的23种内容类型相比,BF因采用组配方式而大大减少了数量。这种组配方式,与ISBD第0项的内容类型由“内容形式+内容限定”组合而成有一定的相似性。这也是我比较喜欢的方式。
ISBD的内容形式仅11种,再加“其他内容形式”,在数量上与BF比较接近。只是美国的编目相关标准,似乎向来无视IFLA的ISBD,在建议稿中根本没有提及。只好自己动手做一个BF到ISBD的对照,了解两者的异同。
对照下来看,BF的资源类型还可以再做些精简——比如可以如ISBD直接用“图像”,或者如“音频”把“静态图像/动态图像”当作子类,或者如ISBD把“动态/静态”像“触摸”一样作为组配。

———BF资源类型与ISBD内容形式/内容限定对照———
语言资料 Language material(书写或讲述形式,子类:book, journal, legislation, newspaper, article, letter, dissertation)——ISBD内容形式 Text 或 Spoken word
附注:BF的“语言资料”比ISBD的“文本”(只包含书写)范围广,电子书可用“语言资料”+“音频”(子类spoken word)?
地图 Cartography——ISBD内容限定-类型 Cartographic
附注:ISBD属“限定”,需与“内容类型”配合使用。用词上,BF特别说明与其他类型一样用名词,不用形容词“Cartographic”
数据集 Dataset——ISBD内容形式 Dataset
附注:完全相同
乐谱 Notated music——ISBD内容形式 Music + 内容限定-类型 Notated
附注:ISBD的Music包括乐谱和实际的音乐,比BF泛指
舞谱 Notated movement——ISBD内容形式 Movement + 内容限定-类型 Notated
音频 Audio(子类:musical, nonmusical, sounds, spoken word)——ISBD内容形式 Music + 内容限定-类型 Performed;Sounds;Spoken word)
附注:BF用泛指的“音频”包括音乐、言谈与其他声音
静态图像 Still image——ISBD内容形式 Image + 内容限定-运动:Still
附注:ISBD用Image包括静态图像和动态图像,比BF泛指
动态图像 Moving image(子类:two-dimensional, three-dimensional)——ISBD内容形式 Image + 内容限定-附注:运动 Moving,+ 内容限定-维度 2-dimentional/3-dimentional
三维实物 Three dimensional object——ISBD内容形式 Object
附注:用词略有不同
软件/多媒体 Software/multimedia——ISBD内容形式 Program
附注:用词不同
混合资料 Mixed material——ISBD内容形式 Multiple content forms
附注:用词不同
合集 Collection
附注:ISBD无对应。此类型似乎与前11种不属同一层次。
手稿 Manuscript(配合前述类型用)
附注:ISBD无对应。现在才想到,ISBD与RDA竟然都没有“手稿”这个非常重要的类型
触觉 Tactile(配合前述类型用)——ISBD内容限定-感官 Tactile
附注:用法相同