3R项目与RDA“四路径”

假期看RSC官网上2017年PPT,最新的是6月底ALA年会上的报告,好几个都是对先前会议上报告的更新,基本上看年会的就可以了。
报告重点自然是3R项目,2017.4-2018.4 RDA内容冻结,进行RDA内容重构和工具包网站重新设计。
RDA内容重构,主要是与IFLA-LRM一致,由此新增元素,也将导致章节发生较大变化,并推倒原有编号体系——变化会相当大。不过,应该类似RDA发布后的“重写”(re-write),条款内容/规则本身还是相对稳定的,因此ALA的RSC代表Kathy Glennan在年初ALA仲冬会议的RDA论坛称,这不是RDA2.0,只是一个新的“内容表达”Outcomes of the November 2016 RDA Steering Committee Meeting)。

3R项目参见:
RDA是个全球标准吗?以使用、翻译和治理作为指标(2016-10-20)
RDA将在2017年依照IFLA-LRM更新(2016-11-21)
RDA为3R项目所做修改(附:多个首选名称)(2017-2-19)

——— 四路径(4-fold path)———
多个报告涉及“四路径”(4-fold path)。按设想,更新后的RDA将在开始的总章中设置“四路径”节,每个元素章节中也会有相应的“四路径”部分。这是个值得注意的变化。
RDA编制过程中,时任RDA编辑的Tom Delsey曾向JSC提出过《RDA数据库实施场景》(RDA Database Implementation Scenarios, 5JSC/Editor/2/Rev, 1 July 2009),有3种场景:场景1关系/面向对象数据库结构,场景2关联书目和规范记录,场景3扁平数据库结构(无链接)。
针对不同场景,RDA提供3种基于文本/字符串(string)的表达方式(并非与以上场景一对一):
1非结构化描述(没有可供机器分拆的内部结构,只能抽取关键词。如转录、自由文本的附注)
2结构化描述(有某种形式的内部或外部结构,如由子元素值组成的规定顺序的字符串,来自取值词表或规范档的术语)
3标识符(“由代码、数字或其他字符串组成的nomen,通常独立于自然语言或社会命名惯例”,区别于基于语言的描述/著录,“本地的”、在全域范围内不唯一。如ISBN,ISNI)
另外在RDA注册/关联数据应用中,还有第4种方式:
4 IRI/URI(基于事物 thing,全域范围内唯一)
所谓“四路径”,即指这4种表示方式。

目前RDA中的结构化描述、非结构化描述,主要针对揭示FRBR实体间关系。但根据以上说明,广义而言也有其他元素提供上述3种方式(尤其是各种转录、各种附注),重构后将扩展到所有元素(不适用者除外),并且会提供相应的样例。ALA年会的《3R项目更新》报告(Update on 3R Project)举了元素”个人所用语言”的例子:
Element: language of person
* 非结构化描述:“The author writes in English”
* 结构化描述:“English”
* 标识符:“eng”
^ IRI: http://id.loc.gov/vocabulary/languages/eng
(其中*指字符串/string,^指事物/thing)

第4条路径的加入,是RDA进一步融入关联数据应用的反映。前面对四路径的说明性文字主要取自RSC现任主席Gordon Dunsire的ALA年会报告: Appellations, Authorities, and Access Plus。他还解释了四路径与LRM用户任务之间的关系:对于“识别”,如果有本地标识符或全域IRI,则不需要“首选”名称字符串;对于“查找”与“探索”,还是需要人读的名称;强调的重点由“规范形式”转向名称的多种形式,可参考虚拟国际规范档VIAF。
最后一句蕴含的意思是:既然名称的作用在于“查找”与“探索”而非“识别”(区分),自然各种名称形式多多益善,哪个“首选”已经不重要了。