RDA不再是编目规则

RDA工具包测试网站上线以来,RDA-L邮件组中各种吐槽,我已经没兴趣再关注了。直到西班牙国家图书馆标准化部的Roberto Gómez Prada发贴力挺新RDA工具包,让我觉得对新RDA有所理解。虽然此贴立马被喷,但之后美国西北大学Kevin M Randall的支持回复让我有茅塞顿开之感,可以说真正理解了新RDA。推荐感兴趣者阅读此系列贴文:
[RDA-L] In favor of the new RDA Toolkit (2018.7.3-5)

Roberto的首句:“也许这会让我成为世界上最不受欢迎的图书馆员,但我必须说,我喜欢RDA正在经历的变化”,RDA-L邮件组的当前状态由此可见。最令人惊心的一句话是:“RDA不再是编目规则”。最让我醒悟的一句话是:“花一点时间思考VIAF。我们不再必需以相同方式记录规范数据以使之易于互操作,只要每个实体得到完美标识”。
Kevin最让我开窍的那一句是:“是否有可能新RDA是更接近国际书目控制理想的又一步?

一直以来我也很困惑,RDA为了国际化,提供各种交替、可选,不同机构的政策声明中所选不尽一致,如此做出来的数据,兼容性或可交换性又体现在哪里呢?新RDA更几乎将所有条款都变成了“选项”,而且没有编号,如果想像以前那样比较不同政策声明的异同,几乎无从着手。讨论中还有人指新RDA没有核心元素,相同元素可选择4种记录方法(4路径),这都造成标准化程度下降。
然而,一直以来我们所认为的文本一致的“标准化”真有那么重要吗?当书目数据采用URI/IRI标识,以三元组(而非一整条记录)发布以后,缺少核心元素、内容有差异都不是问题,可以从多个来源汇总出一条更为丰富的“记录”。

想起2007年RDA编制过程中Karen Coyle和Diane Hillmann的那篇《RDA:20世纪的编目规则》,又去找来看了一下。这次关注到了“Goals Based on the Past”部分,其中对RDA的批评如:坚持“主要”和“次要”概念,原是为在3×5英寸卡片上有效使用空间而设计;资料识别仍关注转录,加上创建文本“统一”题名,以此将相关资源集中在一起显示给用户,但数字世界首选的是URI而非文本。文中并指出了编目员不了解技术进展以及固守原有做法。
新RDA似乎完全在作者建议的路上了。只能说,当年自己并未真正理解作者,在博文中甚至没有提及这一部分。参见:RDA:20世纪的编目规则(2007-1-23)

当然,新RDA实际上仍包含大量编目规则或条款(尽管是可选的)。如果编目规则不再重要,重要的是什么,RDA的意义何在?答案是2位作者推动的RDA词表(RDA注册),由注册元素集确保数据的互操作和融合。参见:
RDA Vocabularies for a Twenty-First-Century Data Environment / by Karen Coyle. Library Technology Reports, v.46, no.2 (Mar 1, 2010)
Diane谈RDA元数据注册的设计(2012-11-18)
RDA:从内容标准到元数据标准. 图书馆论坛, 2014(7):1-7(广告:《RDA:从内容标准到元数据标准》,2014-8-20)

很期待2位作者发表意见。Karen原来常在RDA-L中参与讨论,测试版发布后她并未发言。终于在此贴中等到Diane,不过她除了对Reberto表示赞赏外,并没有发表什么评论,只是认为对应用纲要(AP)的理解有点问题,介绍了几篇相关文章。

对于国内编目,大家最愿意吐槽的就是国图和CALIS记录的不一致。很多RDA研究(包括我的RDA中文化课题),也把重点放在中国编目规则与RDA的比较上。如果这些差异都不再重要?
然后呢?编目员就消失了……

RDA工具包测试网站的“应用纲要”

RDA工具包测试网站6月中上线(参见:RDA工具包测试版网站上线及初步印象,2018-6-14),在RDA-L邮件组中引起热烈讨论。感觉很多人既没有看RSC主席之前的说明(哪些还有待完成),也没有认真看网站内容,就开始喷了——网络时代大概无论中外都这样吧。
也许正因如此,RSC官方几乎没参与讨论,只有一个例外,就是有关“应用纲要”。
[RDA-L] New RDA,在此话题下,西北大学的Kevin M. Randall认为:“RDA本身基本上成为一本数据字典,指定了元素、它们的定义以及在描述中提供它们的指导原则。使用RDA的机构将决定使用哪些要素,遵循哪些可选准则以及用于系统创建完整描述的结构化路径,并记录在应用纲要中”。此说法得到RSC主席Gordon Dunsire的认可,他并说明:“我们预计将开发适用于本地编目文化和传统、特殊资源类别、编目工作流程的不同阶段等的应用纲要……指导菜单中有一个简明、初步的应用纲要草案”。
可以预计,未来应用纲要将是RDA应用的重要方式。循说明去看了网站的应用纲要(此部分无需订阅可访问):Guidance —— Application profiles

Application profiles,通常译为“应用配置文件”,不过在DC时代译作“应用纲要”,似乎在元数据(包括RDA)的语境下更合适。以下内容编译自RDA工具包测试网站:

应用纲要指定在一个元数据集中期望出现的实体、元素和词表编码方案,以满足使用该元数据的应用的功能和要求。也称为规范、说明书(specification),可以指定元素的必备性和可重复性(出现的最小和最大次数),也可以包括描述实体的元数据间关系。

RDA应用纲要
– 可能包含的RDA实体【必备、可选、禁用、不可重复、可重复】
– 必须用于关联两个指定实体的RDA元素【关系】
– 可用于描述和检索实体的RDA元素【属性;必备、可选、禁用、不可重复、可重复】
– 可用于记录指定元素值的RDA记录方法(必须使用、应该使用)
– RDA词表编码方案:必须用作指定RDA元素的结构化描述或标识符的值的来源
– 语法编码方案或字符串编码方案:必须用于对元素的结构化描述的值进行编码

– RDA为资源实体指定基本应用纲要,以符合信息资源的连贯描述。这些可以通过政策声明来阐述。【以下说明政策声明内容】
– RDA指定适用于每个元素的记录方法。
– 可以通过政策声明选择和注释每个实体、元素和记录方法。
– 可以通过政策声明选择和注释用于记录元素的一个或多个可选条款的集合。

– 应用纲要可以表示为用户创建的工作流程。
– 应用纲要可以表示为用户创建的文档。

工具包中的应用纲要【未完成】

关联数据的应用纲要
RDA注册为每个RDA实体、元素、词编码方案和词表术语提供IRI。
注册IRI可以在资源描述框架中创建的关联数据的应用纲要中使用。

IFLA-LRM的连续性资源模型对RDA修订的影响

《国际图联图书馆参考模型》(IFLA-LRM)发布后,自己主要关注比较宏观的方面,没有仔细看特殊资源的建模问题。与连续性资源有关的章节主要是 5.8 Modelling of Serials。

RSC于2018年6月16日发布《连续出版物和其他连续性资源与IFLA-LRM一致问题》,这是RSC和ISSN国际中心就此问题的讨论稿,是差不多一年前的IFLA 2017年会期间,在波兰弗罗茨瓦夫大学图书馆举行的“IFLA图书馆参考模型对ISBD、RDA和其他书目标准的影响”会议时,两机构首次讨论的成果。
RDA工具包测试版本月上线,连续性资源部分尚未完成。确定的变化在官方文件RSC/Chair/19《RDA工具包重构与重设计计划的成果》中有所涉及,从本文档可以看到更多一些信息。参见:RDA已经发生和有待发生的变化(2018年6月3R计划成果)(2018-6-21)

Issues on IFLA-LRM alignment for serials and other continuing resources / Gordon Dunsire. 2018-6-16. RSC/Chair/20
以下摘编部分内容,不一定按原文顺序。引号中为原文翻译,方括号内为个人理解。

【连续性资源】LRM的连续出版物(serials)“适用于所有随时间发布、没有预先确定终止期的资源(也包括集成连续性资源,如活页出版物、网站或数据库)”。“RSC和ISSN国际中心建议使用RDA/ONIX框架(ROF)提供的‘扩展终止’属性”【见下“拆分发行方式”】,LRM的连续出版物(serials)包括所有扩展终止取值为“不确定”的资源,即没有预定终止期的资源(resources without a predetermined conclusion)。

【WEM锁定、超级作品/作品集群】LRM认为“任何连续出版物作品都可以说只有一个内容表达,只有一种载体表现”,本文件称之为“WEM锁定”(WEM lock)。LRM的理由是连续性资源的动态性,不可能预测(以下“不停止发布的转换”)关系将来会保持。因此“连续出版物之间的所有关系都可以建模为作品对作品关系”,即LRM-R22«作品是作品的转换»的子属性。包括:
原始连续出版物作品不再发布的转换:例如,接续、合并、拆分等;
原始连续出版物作品不停止发布的转换:例如,以另一种媒体版本发布、以另一种语言发布、增加新的本地版本等等。
需要超级作品(super-works)或转换作品集群(clusters of transformed works)来汇集这些作品。

【拆分“发行方式”】连续出版物的“大多数数据元素应该与作品层相关”。原来属于载体表现层的“发行方式”,将分为:
作品层:扩展期望(Extension expectation)【属于ROF内容特性】,包括:
扩展终止(Extension Termination)【ROF取值:终止;不确定;不适用】
扩展模式(Extension Mode)【ROF取值:后续;集成;不适用】
扩展需求(Extension Requirement)【ROF取值:必要;无关紧要;不适用】
载体表现层:发行方式(Mode of issuance),与发行资源的单位或载体的数量有关。
参见:RDA建议新载体和内容类别和术语准则(2015-9-11)

【连续出版物作品】“根据LRM(并且与通常的用法相反),‘连续出版物作品’不是已发表的载体表现序列中体现的集合内容表达实现的作品,……实际上是一个发布计划,即发布具有某些特征的一种连续出版物(或其他类型的连续性资源)的计划。例如,一种连续出版物作品的语言可能是多语言的,因为它是其出版商的目标,尽管所有已发表的文章都是英文的”。【未来可能会发表其他语言文章】

【作品标识符ISSN】在LRM中,ISSN是作品的标识符【非载体表现的标识符】。然而由于“连续出版物作品、内容表达和载体表现之间的一一对应,意味着任何层的标识符都是所有WEM‘堆栈’的标识符。实际上,一个ISSN标识一个载体表现、内容表达和作品,但在LRM的环境中,它应该标识堆栈的顶部而不是底部”。【这与作品层的“主题”有某种程度的相似性,内容表达、载体表现也对应与作品相同的主题】

【用“作品vs载体表现”解决“后续款目vs最新款目”冲突】“清楚区分记录数据元素的不同层次,应该有助于解决这个问题。它最终可能会证明这两种方法矛盾少而互补多。【作品/载体表现哪个是后续、哪个是最新?内容表达在哪里?】

【做新记录:作品转换(Work transformation)】“什么样的变化以及在什么程度上,需要在实践中描述新的连续出版物作品”,还没有确定。“RSC和ISSN国际中心应该一起工作,以协调提供给编目员的一般指导和/或具体条款。”

——— 附:部分术语翻译探讨 ———
align(ment) 校准/对齐/一致
continuing resources 连续性资源/持续资源?
instruction 条款
serials 连续出版物【“出版物”是不是太局限?】/ serial work 连续作品?

——— 题外话:ISBD也将依据IFLA-LRM修订———
本文件称,ISBD评审组在2017年IFLA大会期间举行的会议上商定,制定与IFLA-LRM一致的ISBD修订版。
ISBD统一版编制时只是合并了各种文献类型条款,仍是传统的八大项+第0项,完全没有考虑FR模型,且看这次会修订成什么样子、要多少时间才能完成?