新RDA:其他题名信息不属于题名

2020年底新RDA切换为官方版。同时RDA-L邮件组搬了家,重又开始有了点生气。

参见:3R项目结束、RDA-L邮件组迁移……接下来该研究什么?(2020-12-5)

前几天邮件组活跃人物、德国Stuttgart Media University的Heidrun Wiesenmüller教授提出了新RDA的“其他题名信息”问题(Other title information and more in the official Toolkit. 2021-1-27)。最主要的是:其他题名信息不再属于“载体表现题名”。另外,“并列正题名/并列其他题名信息”现在分别是“正题名/其他题名信息”的下位元素,而不是独立的元素。后来的讨论中还提到了下位元素(narrower element,层次结构)与子元素(subelement,整体-部分结构)的差别,也是需要注意的。

发酵了两天,专家终于出场,前RSC主席Gordon Dunsire作了详尽说明,我觉得思路清晰、 很解惑。他的结论是:“其他题名信息”并不总是“题名”,但如果是题名,则可以将其记录为“题名”。Heidrun尽管不认同Gordon的回应,但在ISBD统一版中找出了不是题名的例子,如“与独特题名一同出现的音调、编号、作曲日期和演奏媒介说明”,以及如“小说”之类。

也就是说,对于“其他题名信息”,先转录,如果认为是题名、再提供检索点——其实与原来的做法并无不同。宾州大学图书馆的Jeff Edmunds在讨论中称“LRM/RDA构造的支持者似乎已经从图书馆学滑入图书馆宗教”,或许可以体会到编目员群体对这类“搞脑子”的情绪宣泄。

摘译Gordon回复如下【附加解释】

  • 为什么此元素称“其他题名信息”而非仅“其他题名”?在我看来,这个历史悠久的元素标签表明,并非所有其他题名信息的实例都是题名。
  • “载体表现:其他题名信息”的定义和范围<https://access.rdatoolkit.org/en-US_ala-d12e7ee9-4a94-3ea6-8bb5-5e3ec97a91e9>部分给出定义为“单词、字符或单词或字符组,与某个载体表现正题名同时出现并从属于它。”该定义并不意味着其他题名信息是题名。
  • “预记录”部分指出,其他题名信息可能是未被选择为正题名的题名的来源,但也可能包括通常不被视为题名或没有实用性的其他信息。
  • “预记录”部分包括两个选项,用于将信息记录在另一个元素中。这些选项不是互斥的:
  • 第一个选项<https://access.rdatoolkit.org/en-US_ala-d12e7ee9-4a94-3ea6-8bb5-5e3ec97a91e9/div_zkw_24f_ymb>支持将“其他题名信息”的一部分或全部记录为“载体表现:载体表现题名”或其子类型(因此可以使用如“载体表现:载体表现的变异题名”)。【记录,比如在246字段作为检索点】
  • 第二个选项<https://access.rdatoolkit.org/en-US_ala-d12e7ee9-4a94-3ea6-8bb5-5e3ec97a91e9/div_w4x_tmd_rhb>支持在更广泛的元素“载体表现:载体表现题名和责任说明”中记录“其他题名信息”的转录。【转录,比如照录于245字段】
  • 当然,“记录”部分中的规定<https://access.rdatoolkit.org/en-US_ala-d12e7ee9-4a94-3ea6-8bb5-5e3ec97a91e9/e8cc1d23-8dd8-4d16-a17d-e5180d7e3959>支持记录对于元素本身的转录。【转录,即使用“其他题名信息”元素,比如照录于245字段】
  • 总体而言,这涵盖了提取题名(处理为nomen)以支持检索的情况,或者将整个“其他题名信息”转录为更上位元素或共同扩展的元素【指“载体表现说明”元素】。原工具包和新工具包之间的变化来自于澄清“记录”和“转录”之间的区别,实施新的LRM Nomen实体以及保持连续性。
  • 为了保持连续性和熟悉性,保留了元素标签“正题名”。它与“载体表现的首选题名”相同,并且在词汇表中有一个交叉引用:载体表现的首选题名,见:正题名。
  • “载体表现:正题名”的定义和范围<https://access.rdatoolkit.org/en-US_ala-4b9291c5-f525-37fd-b661-c469e763ce8a/131d685d-032e-429f-85e0-51203fe97317>部分给出了正题名的定义为“在特定应用或上下文中被选择作为首选的载体表现的题名的nomen”。
  • 某些应用倾向于将“并列”信息与“正”信息区分开,而其他应用只希望记录一个“正”元素,并记录“并列”元素以用另一种语言显示相同的信息。在此范围内,不同的应用可能希望对哪个部分“正”做出不同的选择:信息源的第一个实例?使用机构首选语言的实例?掷骰子?因此,RDA中的所有“并列”元素都是“正”元素的子类型。这允许将使用并列元素的元数据语句“汇总”到使用“正”元素的语句:
  • M has parallel title proper “My title”
  • implies:
  • M has title proper “My title”
  • M has title of manifestation “My title”
  • M has appellation of manifestation “My title”【并列正题名,意味着也是:正题名、载体表现题名、载体表现的称谓(高层元素)】
  • 如果原语句有效,则所有隐式语句均有效。使这些隐含语句之一为“真”语句的应用可以与另一个应用在最小公分母元素级别上互操作。
  • 元素子类型不是子元素;原工具包中的区别会延续到新工具包(术语表)中:元素子类型:元素的较窄类别【=下位元素】。子元素:作为较大元素的组成部分的元素,该元素聚合来自两个或多个元素的数据值。

—— 背景知识 ——

  • 1、新RDA中,载体表现的题名(title of manifestation)<https://access.rdatoolkit.org/en-US_ala-6d73e093-3928-3314-ad35-cc4afb3e3e3b>包括6个子类型:正题名、并列正题名、载体表现的变异题名、缩略题名、丛编题名、并列丛编题名。除并列外的其他4项同时也是其下位元素,并列则是相应正元素的下位元素。
  • 2、原RDA中,载体表现的题名(2.3)包括9个元素:正题名、并列正题名、其他题名信息、并列其他题名信息、变异题名、前正题名、后正题名、识别题名(Key Title)、缩略题名。
  • 3、原RDA中,题名和责任说明分列:2.3题名,2.4责任说明。新RDA依据《图书馆参考模型》(LRM)新增“载体表现说明”作为转录元素(用于“非结构化描述”),含13个子类型,其中有“载体表现题名和责任说明”(相当于2.3+2.4的上位元素),此元素“选项”中包括“正题名”“其他题名信息”等原2.3+2.4的下位元素。

从规范控制到身份管理:PCC的工作

偶然看到Cataloging & Classification Quarterly有文章《在全球范围内探索共享身份管理的模型:PCC的NACO身份管理任务组的工作》。因为之前写过《规范控制:从名称选择到实体管理》(数字图书馆论坛2018年第1期第2-7页),对此仍有兴趣。于是第一次通过CALIS外文期刊网的馆际互借、当日达,获取很便捷。文章收到后放了近2个月,今天认真看一遍,结合以前对相关信息的了解,概述PCC在身份管理方面的工作如下。

文章2019年9月投稿,2019年12月在线发布。另:CCQ该期(2020年3/4期)是合作编目计划(PCC)25周年专辑,对国际合作编目、特别是PCC感兴趣的,推荐阅读本辑文章。

Exploring Models for Shared Identity Management at a Global Scale: The Work of the PCC Task Group on Identity Management in NACO / Erin Stalberg … Cataloging & Classification Quarterly, Volume 58, 2020 – Issue 3-4, Pages 428-437. Received 02 Sep 2019, Accepted 27 Nov 2019, Published online: 09 Dec 2019.

导言:在过去的十年中,随着文化遗产社区推动了语义Web就绪标准和技术的发展,图书馆对铸造和链接标识符以创建更好的全球共享实体管理途径越来越感兴趣。在通过国会图书馆和合作编目计划(PCC)的名称规范合作(NACO)进行命名实体的识别和消除歧义时,身份管理活动与传统的图书馆规范控制有很多共通之处。本文专门讨论PCC的NACO身份管理任务组的工作。

PCC《愿景、使命和战略方向 2015-2017》战略方向3:“从主要基于创建文本字符串的方法到侧重于管理身份和实体的方法”【参见:PCC 2015-2017战略规划(2016-6-5)】

《 PCC战略方向 2018-2021》第4项:“ 加速朝着无处不在的网络级创建和身份管理迈进”【参见:PCC 2018-2021战略方向(摘译)(2019-3-24)】

在过去的几年中,PCC探索了各种策略来鼓励图书馆进行身份管理工作:

  • PCC首创行动咨询委员会(PCC Advisory Committee on Initiatives,2011-2014)引入了NACO Lite的概念,该概念旨在降低在现有NACO环境下参与规范工作的障碍【PCC有4个子项目,分别是书目BIBCO、连续出版物CONSER、规范NACO和主题SACO,参与门槛差不多也依此序提高。NACO Lite意在简化程序、扩大规范工作的参与】
  • 2015年,PCC的MARC中URI任务组(PCC Task Group on URIs in MARC)召开会议,以制定管理现有系统中标识符的策略,因为图书馆开始尝试将MARC作为关联数据大规模公开【PCC URIs in MARC Pilot,鼓励在现有MARC记录中增加URI。参见:创制和获取URI的常用词表和参考源指南(2018-3-2);编目常见URI问题:什么时候开始用?RWO又是什么?(2018-3-7)】
  • PCC的NACO身份管理任务组(PCC Task Group on Identity Management in NACO)于2016年负责调查和领导PCC有关将社区从规范控制过渡到身份管理的协调讨论【1、定义了2个关键术语:(1)规范控制:通过规范特定形式的名称或其他术语供访问使用和书目文件维护来管理对实体的访问。规范控制的一个显著特征是它专注于首选的、独特的、人类友好的访问点。(2)身份管理:通过将注册的标识符与指定单个身份或已标识实体的特征数据相关联来进行操作。它的重点是通过使用标识符来区分实体。2、发现9个用例,展示将图书馆规范控制扩展到身份管理空间的机会(隐含:图书馆不参与进去,可能被就此抛弃)】
  • 2017-2018年间,PCC启动了一项试验(PCC ISNI Pilot),测试国际标准名称标识符(ISNI)环境中的身份管理原理:创建、共享和链接标识符,以及创建元数据丰富的生命周期,以实现身份管理活动的分发【2016年在比较ISNI和ORCID后选择与ISNI社区合作。目前合作仍在继续,存在制作同样耗时及费用方面问题】
  • 社区最近开始研究将图书馆数据贡献给Wikidata以及在Wikibase平台中创建标识符的可行性【看到图书馆界通过Wikidata获取获奖音乐家信息及URI的探索,任务组目前正进行Wikidata试验项目:“Wikidata提供了一个平台,该平台可以在协作环境中立即创建关联数据,并且可以自由使用和开放,这与迄今为止探索的其他注册不同”】

结论:使用标识符(而非规范词串)的优点:(1)更具可操作性的元数据,(2)更容易生产,(3)对资源描述中包含实体的更大覆盖,(4)图书馆工作与其他可行合作伙伴的工作保持一致。

开放编目规则:OCR草案发布

2021开年,《开放编目规则》(OCR)发布2020草案(Google文档)。这个草案可以说是一个简要说明,包括:作者、愿景、范围、原则、元素清单和未来发展方向。实质性内容体现在原则和元素清单二部分,“原则”约等于IFLA《国际编目原则声明》(ICP)的13条,仅有极有限的补充修改;“元素清单”则全面体现OCR未来框架:

  • 【范围】元素概述仅适用于非珍稀专著资源。
  • 主要来源:PCC核心/ BIBCO标准记录(BSR)
  • 次要来源:ISBD 2007(无法免费获得2011版);对于实际的编目规则,计划主要依靠ISBD 2007。
  • 模型:BIBFRAME 2.0。仅采用了BIBFRAME的最高级别概念(总共六个:作品、实例、单件、行为者、主题、事件)作为组织元素的方法,以便可以将其用于其他元数据标准(例如Dublin Core)。

元素大纲:

  • I、Instance 实例【12大项(对照ISBD8大项/3-7合并)】
  • 1题名(1正题名、2并列正题名、3其他题名信息、4变异题名、5后续正题名、6与正题名相关的责任说明)
  • 2版本(1版本标识、2与版本相关的责任说明、3版本的命名修订标识)
  • 3生产(主要对非出版单件)(1生产地、2生产日期)
  • 4出版(1出版地、2出版者名称、3出版日期)
  • 5发行(1发行地、2发行者名称、3发行日期)
  • 6制作(如印刷信息)(1制作地、2制作者名称、3制作日期/数字化或印刷日期)
  • 7版权日期
  • 8丛编(1从编正题名、2从编其他题名信息、3与丛编相关的责任说明、4丛编ISSN、5丛编编号、6子丛编正题名、7子丛编ISSN、8子丛编编号)
  • 9发行方式
  • 10实例标识符(ISBN等)
  • 11附件
  • 12附注(1首选引用格式、2题名附注 、3责任说明附注、4用作资源识别基础的期/部分/代附注、5其他类型附注/见IFLA第7部分)
  • II. Carriers 载体【4项】
  • 1媒介类型,2载体类型,3数量,4尺寸
  • III. Item 单件【5项】
  • 1单件标识符,2馆藏地,3保管历史,4采访直接来源,5附注
  • IV. Work 作品【7项】
  • 1首选题名,2形式,3日期,4起源地,5其他区别性特征(如版本),6内容类型(文本、动态图像等),7语言
  • V. Content 内容【6项】
  • 1学位论文信息,2内容概要,3内容语言,4文字,5插图内容(1插图类型、2色彩内容),6附注(1内容清单、2包含:书目/影片目录/唱片目录/索引等、3受众/评分)
  • VI. Access points 检索点
  • 1作品(1创作者、2贡献者、3与作品相关的其他行为者、4相关作品)
  • 2实例(1与实例相关的行为者/如出版者、2相关实例)
  • 3单件(1与单件相关的行为者/如捐赠者、2相关单件)
  • VII. Other elements (covered by separate rules) 其他元素(单独规则)【3项,主题】
  • 1分类,2主题,3体裁/形式
  • 【思考】
  • 1、考虑到ISBD正在修订,用10多年前的ISBD 2007作为主要依靠真的好吗?OCR编制也是需要时间的,为什么不等等直接使用新ISBD?只要加上检索点部分,还不是只适用于普通专著——如果这样,IFLA编目部岂不是会十分高兴?
  • 2、元素清单7个部分,并未如说明所称以6个BIBFRAME概念组织。从其组织看,尽管标出了来自BIBFRAME和ISBD的元素,但原RDA的影子或许更多——其实也没有必要刻意回避。但想想新RDA,还真是让人摸不着头脑。