新RDA政策声明初步印象

要应用新RDA,本地政策声明是个不可或缺的配套文件。因为几乎所有条款都列在“选项”(Option)或“条件选项”(Condition … Option)下,哪怕是唯一选项;有很多并列的选项,相互间也并非互斥关系,可能同时采用。

新RDA政策声明仍开放访问,但链接到或点击后显示在侧栏的RDA正文需要登录。目前RDA工具包的“政策”选项卡中列出了3家的本地政策,分别是:不列颠图书馆BLPS、美国国会图书馆-合作编目项目LC-PCC PS、音乐图书馆协会MLA BP,文件日期均为2021-7-20。

本地政策象工具包本身一样分为“实体”“指引”和“社区资源”3个部分,目前3家内容都还是半成品,详简各自不同。如MLA没有社区资源;LC-PCC链接全部13个实体,BL只链接传统的作品、内容表达、载体表现、单件(WEMI)和个人、团体、家族(PCF)共7个实体;BL链接17个指引中的5个,LC-PCC链接3个(只有1个有实质内容)。

本地政策实体13种指引17种社区资源
BLPSWEMI+PCF(内容少)数据出处载体表现说明记录方法代表性内容表达(均不采用、等待MARC21修改)转录指引(空清单)
LC-PCC PS全部(较详细)载体表现说明(空)代表性内容表达(空)转录指引词表(缩写、语种术语)细化(法律/音乐/官方通信/宗教作品)
MLA BP数据出处

简单看了上述3家的“指引”,有以下几点初步印象:

1、MLA只就音乐资源对某些选项作出规定、忽略通用情况;BL则对所有RDA正文选项作出规定。

2、BL对选项从“采用”到“不采用”细分以下7种:

  • 采用
  • 合适则采用
  • 用于适当的自动化流程
  • 编目员判断(MLA也有)
  • 待定
  • 在MARC21修改前不采用
  • 不采用

3、BL有通用之外的“例外”,如对早期印刷资源采用DCRMR《珍稀资料描述性编目(RDA 版)》

4、“转录指引”是资源描述最基本的规则,分为基本转录、标准化转录和其他转录。LC-PCC采用标准化转录;BL采用标准化转录,但自动化流程采用其他转录,早期印刷资源采用DCRMR。(LC-PCC应该也会采用与BL一致的政策)

参见:

UNIMARC书目和规范格式2020和2021修订

UNIMARC书目格式和规范格式最新版都是第3版,书目格式为2008年,规范格式为2009年,之后的更新在2012年首次发布(updates),自2016年起每年发布。之前更新都写了博文,昨天因故翻看博客,再查IFLA网站,发现2020-2021正常更新。

UNIMARC Updates

  • 大致看过,新增与更新主要在3方面:1)编码、代码及取值;2)专门附注;3)相关作品/内容表达。总体上有助于专指表达、抽取数据用于发现与关联等。
  • 书目格式:新增1个专门附注字段,半数更新在附录,与编码取值相关。
  • 规范格式:新增10个,包括更多编码数据字段(6个)、专门附注字段(3个)以及作品形式/体裁。更新也多在编码数据,以及相关检索点(链接相关的作品/内容表达)。

—— 2020-2021新增与更新 ——

UNIMARC Bibliographic (3rd ed.) Updates

  • 书目格式:2020年新增1处、更新6处(其中4处为附录代码);2021年更新4处(其中2处为附录代码)
  • 100 – General Processing Data (update 2020)【变化:Added related field information to $a/8-16 and $a/17-19. Updated table in $a/34-35. Errata / text edit (deleted FRBR align, no field 184)】
  • 110 – Coded Data Field: Continuing Resources (update 2021)【变化:Update and additions in $a/0】
  • 225 – Series (update 2020)(Update for multipart monographic resources【变化:scope, added $g and $z[y], notes, examples, related fields】
  • 231 – Digital File Characteristics (update 2021)【变化:New subfield $i 可访问性, correction Ex 6】
  • 346 – Note on Accruals and Frequency of Use (new 2020) 累积与使用频率附注
  • Appendix A – Source of Language Code / Sources of Codes (update 2020) (update 2021)
  • Appendix B – Relator Codes (update 2020) (update 2021)【误写作Appendix C】
  • Appendix G – Subject Systems Codes (update 2020)【网站文件链接有误,未看到原文】
  • Appendix H – Cataloguing Rules (update 2020)【网站文件链接有误,未看到原文】

UNIMARC Authorities (3rd ed.) Updates

  • 规范格式:2020年新增9处、更新5处;2021年新增1处、更新5处
  • 101 – Language of the Entity (update 2020)
  • 104 – Coded Data Field: Main Dates of Entity (new 2021)
  • 105 – Coded Data Field: Form of Notation of Expression (new 2020) (update 2021)
  • 127 – Coded Data Field: Duration of Sound Recordings, Visual Projections, Musical Compositions and Performances (update 2020)
  • 128 – Coded Data Field: Form of Musical Work and Key or Mode (update 2020)
  • 140 – Coded Data Field: Content and Form of Work (new 2020)
  • 145 – Coded Data Field: Content Type of Expression (new 2020)
  • 146 – Coded Data Field: Medium of Performance (new 2020)
  • 147 – Coded Data Field: Colour and Sound Content (new 2020)
  • Control Subfields (update 2020)
  • 333 – Users/Intended Audience Note (update 2020)
  • 334 – Awards Note(new 2020)
  • 371 – Note on Expression (new 2020)
  • 378 – Abstract of Work or Expression (new 2020)
  • 531 – Related Access Point – Title (Work) (update 2021)【相关检索点块2021更新多】
  • 532 – Related Access Point – Title (Expression) (Provisional) (update 2021)
  • 541 – Related Access Point – Name/Title (Work) (update 2021)
  • 542 – Related Access Point – Name/Title (Expression) (update 2021)
  • 608 – Form or Genre of Work (new 2020)

参见:

《美国国会图书馆分面词表回溯实施》第一版征求反馈

分面限定是图书馆发现系统的重要功能,具体提供哪些分面,则取决于书目数据。由于MARC设计时并没有考虑分面应用,即使书目数据中含有分面信息,也不一定能够方便地提取应用。美国编目界近年为深入挖掘书目数据中可供分面的信息,进行了相关工作。其中针对现有书目数据加以处理的,属于“回溯”实施,也是内容“增强”之一种。

之前看到美国图书馆协会(ALA)核心主题分析委员会(SAC)分面词表分委员会 (SSFV)的《记录分面时间顺序数据最佳实践》,针对作品和内容表达的日期(参见2021-10-08博文)。

日前又看到SSFV新推出的《美国国会图书馆分面词表回溯实施:图书馆员和程序员的最佳实践》(征求意见草案):

Retrospective Implementation of Library of Congress Faceted Vocabularies : Best Practices for Librarians and Programmers / Prepared by the ALA Core Subject Analysis Committee, Subcommittee on Faceted Vocabularies (SSFV). DRAFT FOR PUBLIC COMMENT, 2022-01-21. (Google文档)

  • “这些最佳实践不假定任何特定的项目范围、编程环境或数据库环境。实施者负责开发代码库,该代码库根据特定环境中的现有MARC数据生成分面数据,然后将新的分面数据写入同一环境中的记录。此类代码可以编写为在 ILS/LSP 或书目实用程序(如Alma、OCLC Connexion、OCLC 记录管理器)中本地运行,也可以编写为在MarcEdit或OpenRefine等‘中间件’环境中运行。”本文件提供EXCEL形式的映射表,供程序员编写代码使用。
  • 由于书目数据的原因,“随着书目记录集变得更大和/或更多样化,自动化流程中人工干预的重要性也相应增加。换句话说,记录集越大和/或越多样化,全自动回溯解决方案提供最佳结果的可能性就越小。必须做出两种妥协之一。要么机器输出需要由人工操作员系统地审查和调整,要么实施者需要容忍最终产品中机器生成的一定数量的不精确(甚至可能不正确)的数据。”根据需要人工干预的程度,设置了映射从简单到复杂的4个“置信度”。
  • 2021年8月开始,SSFV与OCLC合作,使用批处理测试在WorldCat环境中使用“体裁/形式映射”模块映射样本,并根据测试结果不断完善模块中的映射和条件逻辑。

目前的初始版本,列出10个模块,大部分映射表尚未完成:

  • 体裁/形式:将定长字段代码(头标/006/007/008)映射到字段655(体裁/形式)、385(受众特征)
  • 体裁/形式:将LCSH形式复分($v;并选择论题复分$x)映射到字段655、385、386(创作者/贡献者特征)【部分完成】
  • 体裁/形式:将LCSH音乐形式标题映射到字段655【采用前引MLA算法】
  • 体裁/形式:将LCSH文学形式标题映射到字段655【即将到来】
  • 表演媒介:将LCSH音乐形式标题映射到字段382(表演媒介)【采用前引MLA算法】
  • 人口统计/地理:将LCSH标题映射到字段385、386和370(相关地点)(包括文学标题的重要组成部分)【即将到来】
  • 人口统计/地理:将LCSH地理复分(对某些标题)映射到字段370和386【即将到来】
  • 时间顺序:将某些LCSH时间顺序标题/复分映射到字段046(特殊编码日期)/388(创作时间段)【即将到来】
  • 时间顺序:将字段045(内容的时间段)映射到字段046【即将到来】
  • 原语言和代表性内容表达的语言【即将到来】

简言之,即由书目记录中定长字段和主题词(LCSH为主),映射到分面术语表的术语,并放入相应MARC字段(供发现系统或图书馆目录抽取使用)。采用5个术语表,其中3个出自美国国会图书馆(LC):