RSC在RDA中实施收藏模型的决定

RSC在2021年10月的年会上决定在RDA中实施收藏模型(Collections Model),已发布元素变化详情,将在工具包下次更新中体现(目前还没有变化):
在RDA中实施收藏模型 Implementing the Collections Model in RDA <http://www.rda-rsc.org/sites/all/files/RSC-TechnicalWG-2021-2-RSCDecisions.pdf> (RSC/TechnicalWG/2021/2/RSC Decisions. 132 pages. 2021-11-12)

这应该是新RDA成为官方版后首次重要修改,涉及到相当多元素:新元素67个,弃用元素58个、软弃用元素20个,修改元素标签31个,修改元素定义57个,修改元素等级40个,另有附加快捷方式文本元素6个,新词表编码方案2个、新/重新定义术语8个。

本决定基于RDA技术工作组先前为RSC年会准备的一套四部分提案《在RDA中实施收藏模型》:

第一部分“背景”介绍了作出此决定的原因:

“在 3R 项目期间为实施IFLA LRM处理 RDA 中合集时,确定了一项要求,即 RDA 还应制定“收藏”的处理方法。这一要求对于实现以收藏的描述和访问为重点的文化遗产机构越来越多地采用 RDA 的战略很重要。”

  • 并解释了几个概念:合集(aggregate)、收藏(collection)、馆藏(holding)
  • “合集”是体现在一个载体表现中的两个或多个内容表达的集合。【E+E+…=M】
  • “收藏”是收集两个或更多单件以形成载体表现的计划。单件在创作后收集在一起,形成收藏载体表现。【I+I+…=M】
  • “收藏”可以粗略如研究图书馆的整个馆藏(holding),也可以细化到特定人发表的论文。【换言之,收藏被视为馆藏的子集,如某个专题馆藏、特藏】
  • 附件1中收藏单件(collection item)有范围注释:一个收藏单件指由收藏作品收集的所有单件集【类似于套件整体算一个单件】。此范围注释没有出现在RSC决定文件中。

根据RSC/TechnicalWG/2021/2/RSC Decisions,大致归纳下新增、弃用与改名元素情况如下。

新增元素

1、新增元数据描述

  • (1)元数据描述[规范形式],如:Agent: agent described with metadata by(13个类均有)
  • (2)元数据描述作品[记录],如:Work: metadata description of agent(13个类的作品)
  • 元数据描述(定义):元数据作品是一种汇总作品(aggregating work),它是一项计划,用于选择和安排一个或多个元数据语句的一个或多个内容表达,这些语句描述 RDA 实体的一个或多个单独实例,并将它们体现在一个合集中。该计划可以是应用纲要的一部分。
  • 【基础认知是将元数据记录视为“作品”。可以在应用纲要定义元数据作品的内容】

2、涉及资源WEMI的定义域与值域变化(同时弃用原元素)

  • (1)Agent系列元素值域由Item改为Work,如:Agent: collector agent of (range = work) ->  collector agent of (range = item)
  • (2)对应的Item系列元素改为Work系列,如:Work: collection registrar agent -> Item: collection registrar agent
  • (3)WE改为M:catalogue, index, finding aid,如:Expression: finding aid expression和Work: finding aid work ->Manifestation: finding aid(互逆属性同)
  • (4)WW变为WE关系:词汇索引,Work: concordance work->Expression: concordance work

3、新增馆藏/收藏相关

  • (1)馆藏/单件:Item: holding of [M]和Manifestation: holding [I]
  • (2)馆藏地:单件Item: location of item [Place]和Place: location of item of,馆藏Manifestation: location of collection [Place]和Place: location of collection of
  • (3)子收藏:Manifestation: subcollection [M]和Manifestation: subcollection of [M]

弃用元素(除以上新增对应外)

  • (1)单件的curator相关agent元素(5对),如:Item: curator agent【根据建议4,curator被认为等同于collector】
  • (2)摘要(abstract, summary)、评论(critique, evaluation, review)类元素【看建议3,应为调整到其他WEMI类】

修改元素标签

  • (1)主要由in改为by,如:Agent: agent described in -> agent described by
  • (2)省略实体/类名如work/item,如:Work: abstracted as work -> abstract
  • (3)修改术语,如Item: accompanied by item -> held with,再如:Manifestation: issued with -> on carrier unit with

附录G:新词表编码方案及新/重定义术语详情

  • 收藏方法(RDA Collection Accrual Method):借入loan、呈缴deposit、捐赠donation、许可license、购买purchase

3R项目最终报告

3R项目在2020年12月15日新RDA成为官方版即告完成,近一年后发布最终报告:

3R Project Final Report (RSC/Papers/2021/1,最后修订2021-10-28)

“本报告总结了 RDA 工具包重组和重新设计 (3R) 项目(2016-2020)的过程和结果,该项目由 ALA 数字参考部(RDA 工具包的出版者)和 RDA 指导委员会 (RSC,负责《RDA:资源描述与检索》的内容)。该项目产生了更新和更灵活的底层基础设施来支持该标准,一个显著现代化和改进的工具包网站,以及更新和重组符合《国际图联图书馆参考模型》(IFLA LRM) 的 RDA 条款和指南。”

【目次】起点;目标;组织方法和过程;早期决定和原则;基础设施开发;工具包网站设计和功能;RDA和工具包结构;RDA内容;翻译;政策声明;外部沟通与反馈;导览;持续关注和未来发展;附录:时间表,致谢

(以下为摘译或编译)

【起点】RDA 工具包重组和重新设计 (3R)项目的广泛目标是“增强 RDA 工具包网站,使其能够更好地满足用户的需求,并在他们的工作中发挥更高效的作用。”其目的一既改变网站外观和感觉,也重新调整RDA内容以增加条款的灵活性、实用性和国际适用性。项目准备启动时正逢作为RDA基础的FR家族升级版至《国际图联图书馆参考模型》(IFLA LRM),与其兼容的工作也被纳入项目。

【具体目标】

工具包功能

  • 重建技术基础设施和数据存储库以提高模块化和灵活性,并使它们与当前的最佳实践保持一致。
  • 采用响应式设计。
  • 遵守当前的数字无障碍要求。
  • 通过内容集成和更大程度的定制增强用户体验,并创建更本质上“web的”用户体验。
  • 改进修订和变更报告机制。
  • 实施个性化以允许用户设置首选项。
  • 改进支持 RDA 翻译的基础设施。
  • 实施一种设计,无需多次单击即可将说明和政策声明集中在一起进行显示。

RDA内容

  • 更新 RDA 使其与 IFLA LRM 保持一致。
  • 重组 RDA 的结构以支持 IFLA LRM 和关联数据实践。
  • 将RDA 参考(RDA Reference)数据更全面地集成到RDA 条款中,以实现更高效和有效的维护。
  • 优化 RDA 以供国际使用,包括消除西方中心。
  • 针对关联数据环境优化RDA。

【原则】关于RDA内容规定了10+2项原则,特别值得提及的是一般原则中“RDA 组织是一种重新安排,不会改变当前的编目实践”,以及后期添加的2个关于示例和翻译的原则:[1] 示例不被视为基础 RDA 的一部分。[2] RSC 不应继续并行翻译所有内容的原则;翻译需要能够自定义例子,选择相关的非RDA资源进行翻译。

(RDA内容变化之前已写过不少博文,本博文略过。现在关心实施前需要做的翻译和政策声明。)

【翻译】

  • 部分翻译)使用电子表格翻译RDA参考(RDA Reference)数据,包括RDA取值词表、RDA元素集。这些在RDA注册(RDA Registry)中发布。
  • 完整翻译)包括指南(Guidance)和条款(instructions)。实施 Trados 软件,它通过“记住”和共享术语、短语和早期版本翻译的工具提供更有效和高效的翻译。对于 3R 项目,还使用 Trados GroupShare 平台帮助翻译团队管理他们的翻译项目。 2019 年 4 月宣布英文文本稳定后,Trados 培训于当年 9 月和 10 月举行。经过培训后,芬兰语和挪威语翻译人员迅速取得进展。首先要翻译的是大型英文样板文件(重复使用的文本将填充许多元素条款文件),然后是其他包含用户界面和其他模板化文本的小文件。通过按此顺序工作并在各种脚本的帮助下,大多数工具包元素页面将自动翻译,无需人工干预。但是,指南章节和大约 500 个元素文件仍需要通过 Trados 进行“自定义”翻译。芬兰语翻译团队于2020年3月完成RDA指南的翻译;此后立即开始测试将这些文件上传到 CMS 并准备发布。最初的芬兰语和挪威语翻译版本于 2020 年 9 月发布,更新数据发布于 2020 年 12 月(最终 3R)版本。

【政策声明】曾经测试使用脚本设置基本 RDA 和政策声明之间的链接,以避免大量手动编辑,也减少人为错误的可能性。目前推荐电子表格+自动化批处理流程,以加快将数据输入内容管理系统(CMS)。

【未来】ALA数字参考部和 RSC希望在 3R 项目中包括以下领域,但由于各种原因,这些领域需要推迟以备将来注意:

  • 工具包内集成并放置应用纲要(application profile)
  • 集体行为者(collective Agent)的进一步开发。
  • 馆藏级(collection level)描述的进一步开发。
  • 社区资源(community resources)部分的细化和开发。
  • 数量(extent)条款开发。
  • 通用映射工具实施。
  • 表演合集(performance aggregates)开发。
  • 关系矩阵(relationship matrix)。曾有过,2020年6月删除,有人希望未来复活。[当时关系是附属于元素的说明语,现在是独立的元素]
  • 与BIBFRAME 的关系。有关两者关系和互操作的沟通始于 2019 年 7 月 [参见后附博文],仍在继续。 RSC 还打算制定标准间的映射。
  • 专业意见(Specialized views)。官方工具包旨在提供多种功能视图,例如针对专业社区(例如,音乐、法律、善本书籍)的视图。
  • 可视化浏览器,也称图形浏览器。(2018-2019年尝试后停止)临时解决方案是添加面包屑导航。

【里程碑】附录有项目4年详细的时间表(2016/10/12-2020/12/15),其中6个“里程碑”记录在正文“组织方法和流程”:

  • 2016 年 10 月 12 日:3R 项目公开宣布
  • 2017 年 4 月 11 日:原始工具包的最终版本;内容被冻结
  • 2018 年 6 月 13 日:公开发布测试版工具包;项目结束前有8个后续版本
  • 2019 年 4 月 30 日:测试版工具包的英文版宣布稳定,允许进行翻译和政策声明的工作
  • 2020 年 3 月中旬:[新冠肺炎]全球大流行影响所有人的工作任务和流程
  • 2020 年 9 月 16 日:第一个版本,包括翻译(芬兰语和挪威语的部分翻译)和大英图书馆和美国国会图书馆/合作编目计划的政策声明测试集
  • 2020 年 12 月 15 日:测试版工具包成为官方工具包,原始工具包移至不同的 URL;3R项目正式结束

【致谢】感谢名单长达100多人,特别致谢时任RSC主席 Gordon Dunsire 的“远见与领导”(vision and leadership)。

[Gordon Dunsire 接替 Barbara B. Tillett,是2011年 RDA 发布后第2位RSC主席(2013–2018),离任后继续担任技术团队联络官至3R项目结束(2014-2020)。尽管现已没有职务,仍如之前那样在RDA-L邮件组中参与讨论、解答问题。]

参见:

LC目录查BIBFRAME转换记录无果

今年年中看到BIBFRAME更新论坛又讲到“BIBFRAME 100”,即美国国会图书馆(LC)去年有100名编目员、每周2天、以BIBFRAME编目,2021年起改为全部350名编目员、每周5天、以BIBFRAME编目,并且不再做MARC记录,此100仍100%之意。

计算一下:350人*5天*25周/半年=43750人天

假定每人每天做3种,就会有13万条BIBFRAME记录,即使少至1种、也该有4万条以上。

由于LC并未更换系统,因此其目录中的新增记录应该都是由BIBFRAME转换而来的MARC记录。这些记录长什么样?是不是和BIBFRAME到MARC转换界面看到的一样?于是想查一下。

在BIBFRAME到MARC转换中,转换而成的MARC记录中有884字段(2015年新增),形如:

884 $aDLC bibframe2marc v1.1.0-SNAPSHOT $g20210619231058.0 $qDLC $uhttps://github.com/lcnetdev/bibframe2marc

用LC目录的专家搜索查这个特征,是不是可以找出来由BIBFRAME转换而来的记录呢?
于是到LC目录:

一、关键词搜索(专家搜索)Keyword Search (Expert) https://catalog.loc.gov/vwebv/searchKeyword

  • 884A bibframe2marc(Your search could not be processed as entered.)
  • K884 bibframe2marc(Your search could not be processed as entered.)
  • 说明884不可查。

二、再看搜索帮助:Search/Browse Help — Keyword Bibliographic Index Configurations https://catalog.loc.gov/vwebv/ui/en_US/htdocs/help/index_keyword.html

三、是真没有,还是查不到?再试着查2021年或2020年编制的记录(LCCN以2021或2020起始)。

  • 高级搜索,选择途径LCCN:
  • 2021(Your search found no results.)
  • 2020:2条(分别是010=2020,显然有误;010=2020938908)
  • 查其他年份,没有结果——结论:LCCN只能完全一致检索(2020年那条能搜索到的原因不明)

四、再查2021或2020年出版文献(008字段第1出版年),专家搜索:

  • 008D 2021(大多在版编目记录,有263字段计划出版日期)
  • 008D 2020(大多在版编目记录,有263字段计划出版日期;今天查在版编目记录明显减少)
  • 记录005或008字段显示2021年的,均未看到884转换字段。
  • 放弃。

今天与同行讨论此事,想起当初(2021-7-8)所写上述内容,放出。

个人猜测,LC当前的自动化系统在导入由BIBFRAME转换而成的MARC记录时,屏蔽了884字段,导致字段信息丢失?

参见:

LC联机目录的“专家搜索”(2015-10-6)

BIBFRAME/MARC数据双向转换程序更新(880字段消失)(2021-6-20)

884字段:描述转换信息(2015新增)https://www.loc.gov/marc/bibliographic/bd884.html

  • $a – Conversion process (NR) 转换处理(如: DLC bibframe2marc v1.1.0-SNAPSHOT)
  • $g – Conversion date (NR) 转换日期(yyyymmddhhmmss.X,如:20210619231058.0)
  • $k – Identifier of source metadata (NR) 来源元数据标识符
  • $q – Conversion agency (NR) 转换机构
  • $u – Uniform Resource Identifier (R) [转换程序]URI(如:https://github.com/lcnetdev/bibframe2marc)