面向机器应用的RDA(2018ALA仲冬会议上的RDA-续)

《资源描述和检索》(RDA)通常是被当作编目规则而存在的,但在它以联机版工具包(RDA Toolkit)发布之后,对元数据注册方面的重视逐渐增强。随着3R计划对工具包网站的重新设计和对RDA本身的重构,它进一步强化了编目规则以外的职能。尽管对这方面的进展有所关注,2014年时还写了篇文章《RDA:从内容标准到元数据标准》(图书馆论坛,2014(7):1-7),但看到Kathy Glennan在2018 ALA仲冬会议PCC成员会上的报告,还是给震住了:供编目员使用的工具包(RDA及辅助资料),只是RDA体系中一小部分、也是唯一收费内容,其他大部分是提供给应用开发者和机器使用的免费内容。

Kathy Glennan. RDA, Linked Data, and the 3R Project(RDA、关联数据和3R计划)

– RDA正在更多地变为数据字典,不同部分提供给不同类型用户【PPT第5张】
RDA Reference 参考 –> 开发者
RDA Vocabularies 词表 –> 开发者
RDA Registry 注册 –> 应用开发者
RDA Vocabulay Server 词表服务器 –> 开发者【根据第11张和下图补】
RDA Toolkit 工具包 –>编目员
RIMMF –> 培训者
– 核心部分在“RDA参考”【PPT第6张】
所有RDA元素及其定义和相关范围注释,所有取值词表术语及定义,包含翻译
以RDF关联数据格式存储在“开放元数据注册”(Open Metadata Registry, OMR)网站
RDA工具包内容的主要来源
– RDA参考数据工作流【PPT第14张】

RDA Ref Data Workflow

可以感觉到RDA雄心勃勃。然后问题来了:有了RDA词表,还需要BIBFRAME吗?刚完成一篇国际编目标准现状与进展的文章,结尾是“群雄逐鹿、未知鹿死谁手?”[update 2018-2-26将在《图书馆论坛》发表、中国知网优先数字出版]

在2018 ALA仲冬会议RDA关联数据论坛上,康奈尔大学Steven Folsom的报告,介绍梅隆基金资助的LD4L-Labs和LD4P项目对BIBFRAME的扩展(bibliotek-o),很重要的部分是重用RDAu(即不限定WEMI的RDA元素)。对于BIBFRAME和RDA,他最后的设问是:[一起]向前走,还是再次分道扬镳?

Steven Folsom. non-RDA is the new non-MARC: bibliotek-o and RDA
bibliotek-o: a BIBFRAME Ontology Extension

参见:
Diane Hillmann谈书目框架转换行动(2012-7-7)
图书馆从传统数据观走向关联数据及语义网:五周年(2012-5-16)
Diane谈RDA元数据注册的设计(2012-11-18)
JSC会议有关RDA注册的讨论与决定(2012-11-18)
RDA注册元素集终于正式发布(2014-1-23)
JSC主席Gordon Dunsire论《RDA和语义网》(2014-3-17)
RIMMF:多元数据格式中的RDA(附广告:《RDA:从内容标准到元数据标准》)(2014-8-20)
Christine Frodl和RDA注册前史(2018-2-12)

在RDA中例示LRM(2018ALA仲冬会议上的RDA)

刚结束的2018年ALA仲冬会议上,RDA有三个官方会,即:2月9日会前会“RDA工具包重设计更新与预告”(RDA Toolkit Redesign Update and Preview),2月10日RDA更新论坛(RDA Forum)和2月12日RDA关联数据论坛(RDA Linked Data Forum)。另外RSC候任主席Kathy Glennan(2019-)还在FRBR兴趣小组、CC:DA会议和PCC成员会上作了3个报告(其中一个代现任主席Gordon Dunsire)。在RSC网站报告新版块上其中12个报告已上线(主要是会前会):
RSC Presentations / RSC Presentations 2018

会前会集中介绍3R计划后RDA将会发生的变化,这些变化主要源自IFLA-LRM。Kathy Glennan在FRBR兴趣小组上的报告《在RDA中例示LRM》可视为RDA变化概要,其他报告则分别针对其中的若干变化详细解说。以下概述该报告,并提供到具体报告的参见:

在RDA中例示LRM(Instantiating LRM in RDA
– 来自LRM的新实体和新属性
— 新实体
行为者Agent,集体行为者
命名Nomen【详见:Recording Names and Access Points(记录名称和检索点)检索点扩大到所有实体】
地点Place,时段Timespan【详见:Timespan(时段)】
RDA实体(RDA entity)代替LRM的Res(作为其子类,同时是所有其他RDA实体的超类)
— 新属性
类别、附注(来自LRM的Res,可用于任何实体)
载体表现说明【详见:Recording methods, Transcription, and Manifestation Statements(记录方法、转录和载体表现说明)转录的2种方法:基本转录和标准化转录】
代表性内容表达【详见:Representative Expressions(代表性内容表达)】
– 由FRBR到LRM的变化
— 区别真实与虚构实体:虚构的个人、地点和时段在LRM中是Res实例,在RDA中仅作为命名或载体表现说明记录【详见:RDA and Non-Human Personages(RDA与非人类角色)】
— 关系优于属性:地点和时段属性代之以关系(会议日期、坐标、地址),“称呼关系”链接命名实体的子类(标识符等)到任何其他实体(载体表现的标识符、内容表达的题名【!】、个人的名称)
— 集合作品(不同内容表达合在一个或多个载体表现)与整体/部分作品
— 连续出版物新模型:连续出版物作品=按顺序发行的集合载体表现;任何连续出版物都是作品实体的不同实例(称为WEM Lock:作品/内容表达/载体表现锁定)【详见:The Modeling of Serials in IFLA LRM and RDA(IFLA LRM中连续出版物建模与RDA)不同语言版本、地区版本、载体版本是作品间关系】
— 属性由作品移动到内容表达:调性、演出媒介、受众(将导致增加使用新的“代表性内容表达属性”)
– LRM以外的变化
细化某些实体(保留团体和家族)
定义和增加附加属性(遵循LRM:为超类定义的属性自动适用于子类)
实施不同的记录方法(即4路径4-fold path)【详见:Recording methods, Transcription, and Manifestation Statements(记录方法、转录和载体表现说明)】
历时作品:计划随时间推移而包含的作品;作品内容随时间变化【详见:The Modeling of Serials in IFLA LRM and RDA(IFLA LRM中连续出版物建模与RDA)历时作品、集合作品、连续作品、集成(整合)作品)】

参见:
RDA将在2017年依照IFLA-LRM更新(2016-11-21)
RDA实施IFLA-LRM公告(2017-2-6)
RSC关于IFLA《图书馆参考模型》的宣告(2017-9-20)
3R项目与RDA“四路径”(2017-8-7)
RDA的3R计划延期及未来的12个实体(2017-12-6)
RDA重构计划常见问题(2018-1-4)
2017年RSC年度报告:RDA进展(2018-2-13)

纪年铭(Chronogram)

看国图政策声明(中国国家图书馆RDA政策声明笔记),从书中学到了一个新知识:纪年铭(Chronogram)。

【必应词典】chronogram:(用大写罗马数字之和表示的)纪年铭文

RDA制作、出版、发行、生产年条款中均有“纪念铭”,只在2.8.6.4举了例子,没有给出相应的年份:
Ipso anno tertIo saeCVLarI typographIae DIVIno aVXILIo a gerManIs InVentae
如此诡异的文字,完全不知道到底是什么年份。即使在书上看到也认不出、不会认为是纪年。

《国家图书馆外文文献资源RDA本地政策声明暨书目记录操作细则政策声明》第82页举例并有脚注,抄录如下:
264 #1 $cChrIstVs DuX ergo trIVMphVs [1627]
纪年铭(Chronogram)是指句子或铭文中的特定字母解读为数字,重新排列代表具体的日期。自然顺序的纪年铭以正确的数字顺序显示所有数字,例如AMORE MATVRITAS=MMVI=2006。计算的具体方法是:M=1000,D=500,C=100,L=50,X=10,V=5,I=1,相加求和,左减右加,IV=4,VI=6。

换言之,纪年铭为一小段文字,其中含罗马数字7种字符MDCLXVI,有2种相加求和方式:一种将罗马数字字符按从大到小顺序重新排列,另一种保持原序、左减右加。
仍不明了的是,何时需“重新排列”,何时是“自然顺序”可以直接“左减右加”?
以国图政策声明书中例子出现的大写字母为例:
书中应该是按7种字符顺序重新排列计算的:MDCXVVVII=1000+500+100+10+5*3+1*2=1627
如果直接求和则为:CIVDXIVMV=100+4+500+10+4+1000+5=1623(如果按罗马数字X+IV=10+4也可能是XI+V=11+5,则合计1625)
这说明,不但顺序不是任意的、不能随意重排,左右结合也是有优先级的。

前述RDA本身的例子,显然非自然顺序,需要重新排列(其实不重排、只要不左减右加,结果应该是一样的):
IICVLI DIVI VXILI MIIV=MDCLLXVVVVIIIIIIIIII=1000+500+100+50*2+10+5*4+1*9=1739
看上去很像一个年份,但也难保没有算错。真不明白古人如此折腾一个年份意义何在?