增强MARC书目记录中元数据(SCA工作组最终报告)

最近十多年,针对关联数据在图书馆中的应用,MARC21标准经过多轮扫描更新,其中最重要的变化就是在越来越多的字段中加入控制子字段、记录可解引到RDF的URI,用于增强MARC记录:

  • 2016年重新描述$0规范记录控制号或标准号,取消可解引URI的前缀代码(URI)(其他号码仍需前缀);
  • 2017年新增$1真实世界对象URI。

字段加入URI子字段$0$1,从检索点及代码开始,现在进入到描述性字段。近日合作编目项目(PCC)上线新的报告:

《增强MARC书目记录中元数据和实践的SCA(应用常务委员会)工作组最终报告》Final Report of the SCA Task Group on Enhancing Metadata and Practices in MARC Bibliographic Records. 2023-1-17

报告2023-1-17完成,2023-5-11政策委员会(PoCo)评审,2023-8-31批准了报告建议的10个字段中的8个,预计将体现在MARC标准的后续更新中。

报告审查了82个字段,在非结构化文本中识别出实体,对其中10个描述性字段提出建议。建议包括增加$0和$1子字段,以及对当前政策(即现行编目指导文件)的修订。当前政策引用的现行编目指导文件主要是:

  • 原RDA和官方RDA,主要讨论其中的LC-PCC PS(政策声明)
  • MGD(元数据指导文档)
  • 341字段还引用3种OLAC最佳实践:OLAC Best Practices for Cataloging Objects Using RDA and MARC21,OLAC Best Practices for Cataloging Streaming Media,OLAC Best Practices for Cataloging DVD-Video and Blu-Ray Discs
  • 506和540字段还引用:Provider Neutral E-Resource Guidelines

附录A对10个描述性字段的建议,概要如下(其中7个添加$0$1,5个得到批准/其中1个MARC标准已更新)

  • 024 – Other Standard Identifier (R) 其他标准标识符【添加$0$1,更新GMD】
  • 210 – Abbreviated Title (R) 缩略题名【添加$0$1,创建PS+更新MGD(建议未批准:PCC CONSER试点小组或美国ISSN中心不建议实施210字段)】
  • 300 – Physical Description (R) 物理描述【更新PS+创建MGD】
  • 341 – Accessibility Content (R) 可访问性/辅助内容【添加$0$1,添加$2+创建无障碍词表+来源代码,创建PS+更新MGD】
  • 504 – Bibliography, Etc. Note (R) 书目等附注【推荐使用353字段/辅助内容特征,更改PS+MGD/使用受控词表=补充内容代码】
  • 506 – Restrictions On Access Note (R) 访问限制附注【添加$0$1,更新术语来源代码,创建PS+更新MGD/鼓励使用856$l(建议未批准:出于相同目的已经存在856$l)】
  • 536 – Funding Information Note (R) 资助信息附注【确定各种资助号是否有可用URI;710记录资助者】
  • 540 – Terms Governing Use And Reproduction Note (R) 管理使用和复制条款附注【添加$0$1,更新访问限制条款来源代码表,创建PS+更新MGD/使用856r(与506近似但被接受)
  • 586 – Awards Note (R) 奖项附注【添加$0$1,结构化/添加$c奖项类别$d奖项日期,创建PS+更新MGD】
  • 658 – Index Term–Curriculum Objective (R) 索引词—课程目标【添加$0$1(文中所引MARC讨论稿已批准/MARC标准2023-6-21已更新)】

工作组的8条原则:

  • 1.尊重并肯定先前PCC工作组关于描述性字段的建议。
  • 2.在考虑是否以及如何将描述性字段适用于关联数据时,注意编目员时间和资源的投资回报。
  • 3.在评估拟议的实践变更时,考虑回溯协调(reconciliation)的必要性,以及此类协调所需的资源。
  • 4.评估MARC字段是否明确地传达了单个对象引用。
  • 5.请记住,并非所有URL/URI都可以用于关联数据;关联数据需要一个可以解引到RDF中的URI。
  • 6.保持在工作组根据职责确定的范围内。
  • 7.具有明确标识的词表的字段值可以机械地转换为关联数据,而不必要求编目员在MARC数据中嵌入子字段$0或$1 URI。
  • 8.当数据在记录中其他地方的机器可读字段中复制时,人类可读字段不需要适应关联数据,这些字段可以更容易地用于关联数据。

可以看到对工作效率的重视。而附录B(增强现有描述性字段的工具和策略)更是针对以上每个字段,提出各自使用软件工具识别或批量更新的建议。

参见:在MARC中使用URI:URI指导小组最终报告(2023-8-29)

在MARC中记录URI的核心词表(《NACO 024最佳实践指引》)

合作编目项目(PCC)在2019-2021年开展了两项以MARC记录URI的试验,意在由名称的规范控制走向实体的身份管理。在2023年3月的“URI指导小组最终报告”中,列出了正式开展此项工作的6个核心文档,其中一个核心文档曾在2018年博文中写过其早期版本:[5] Formulating and Obtaining URIs: A Guide to Commonly Used 由Vocabularies and Reference Sources. (2020)。参见:

本文围绕另一个核心文档的最新版本,关于在LC名称规范档(NACO)的MARC 024字段中记录URI的指引:[2] NACO 024 Best Practices Guidelines. (2019-2023)

024字段:其他标准标识符,除ISBN、ISSN等以外的标准号或代码或URI(书目与规范格式相同)

鉴于一条记录中出现过多024字段对用户与本地系统维护造成的麻烦,提出本最佳实践。简单地说,就是规定一般限制每条规范记录最多5个024字段。为此提出“核心词表”,当已有5个或更多时,只有出自“核心词表”的才能添加。

本指引中的核心词表,以表格示例方式,分别列举不同类型实体的来源。概要如下:

  • 个人名称:Wikidata, ISNI, ORCID, VIAF, ULAN, WorldCat Entities
  • 家族名称:VIAF, Wikidata, CERL, ULAN
  • 团体名称:Wikidata, ISNI, VIAF
  • 地理名称:Wikidata, GeoNames, TGN, WorldCat Entities
  • 作品和内容表达:Wikidata, VIAF, MusicBrainz, BBC Things, DBpedia, FAST, WorldCat Entities

虽然这是个要求遵守的政策文件,但此“核心”词表不是强制性的(并且会维护更新)。可以根据机构与馆藏的需要使用任何词表,包括前述[5]中所列词表,需要注意只有前述5个024字段的数量限制。

指引还指出,OCLC Connexion(编目软件)中的Authority Toolkit可用于搜索外部词表,并根据这些词表正确构建URI。

我们编目的酷东西

曾多次在PPT中引用一张Flickr上的照片,一位笑嘻嘻的编目员与一具人体骨架勾肩搭背,标题是“我编目了这个”,用来说明早年的编目规则就面向广泛的编目对象。

2021年秋,美国图书馆协会(ALA)大学和研究图书馆协会(ACRL)珍本和手稿部门(RBMS)书目标准委员首次举办短演讲网会“我们编目的酷东西”(Cool Things We Cataloged),演讲者介绍经手过的令人难忘的编目对象,特别强调在为不同寻常的古物提供描述和检索点方面,用来解谜和应对挑战的各种工具和技能。

今年是短演讲网会的第3年,目前正在征集演讲者,会长约1小时、每个演讲7-10分钟,9月15日报名截止:

CFP: “Cool Things We Cataloged” Fall Webinar (Due 9/15/23)

我们正在寻找各种各样的演讲者(编目员、档案管理员、辅助专业人员、学生、实习生等)。如果你已经编目了你认为很酷的东西,那么可以考虑演讲。这些物品可能是图书、地图、地球仪、厨房用具、园艺工具、教育工具包、乐谱或其他任何东西。演讲者将讨论为什么一个对象或一组对象对编目来说是一个挑战,他们是如何编目的,他们用来编目的资源(如内容标准),以及他们在编目时学到的信息。

看看前两年报告都有些什么酷东西?似乎主要是特藏:

2021年短演讲会PPT:Cool Things We’ve Cataloged – September 2021. URI: http://hdl.handle.net/11213/16711

• Kaydian Campbell: “Mayrent Collection of Yiddish recordings”(Mayrent意第绪语录音集)【s3-19,收藏概况,访问网址https://search.library.wisc.edu/digital/AMayrentRec,唱片展示,编目者,编目方式(元数据=DC到MODS到MARC、自动化=Ruby编程+shell脚本、资源…),规范控制,参与团队,联系方式】

• Julie Christenson: “Cataloging the Jewish Diaspora: The I.O. Lehman Collection at Texas Christian University”(犹太侨民编目:德克萨斯基督教大学的I.O.Lehman收藏)【s20-38,收藏概况/语种、年代,…】

• Anna M. Ferris: “Cataloging Nuremberg Trial Proceedings in the Harry W. Mazal Holocaust Collection”(Harry W.Mazal大屠杀收藏中纽伦堡审判录的编目)【s39-46,合订,检索策略=人名+LC分类号】

• Felicia A. Piscitelli: “Without a Title Page, Preliminaries, or a Colophon: or, the Cataloger as Detective”(没有题名页、文前序页或版权页:或者,编目员当侦探)【s48-57】

• Naomi Shiraishi: “Japanese Historical Maps”(日本历史地图)【s58-70,Mitsui收藏中的地图收藏2000件,伯克利图书馆-数字收藏-日本历史地图】

• Amanda K. Sprochi: “15th-century Mamluk Qur’an”(15世纪马穆鲁克古兰经)【s71-80,书影,参考资料】

2022年短演讲会PPT:Cool Things We’ve Cataloged – October 2022. URI: http://hdl.handle.net/11213/19165

• Amy Swanson: A Widow’s Plea in 17th Century Spain(17世纪西班牙一位寡妇的恳求)【s3-11,1641年34页西班牙语印刷本。如何克服西班牙语障碍,解码家族树,完成MARC记录,参考书目】

• Geanna M. Hernandez-Phan: Variants of Erle Stanley Gardner’s novels(Erle Stanley Gardner小说的变体)【s12-25,不同版本记录的强化过程】

• Kim Schwenk: Gato Negro Ediciones, Or, how to start a class(ification) war(黑猫版,或者,如何发动分类战争)【s26-44,黑猫版,Risograph [一种彩色印刷方式,s31有详细介绍],墨西哥2013-2021年西英双语,当代艺术展出版物,MARC记录,编目体会】

• Leia Lynn: Ace Double Novels(Ace双面小说)【s46-52,Ace Books在1950-1970年间出版的双向倒印小说,MARC记录】

• Linh Uong: s.t.e.m. kits(stem(科学技术工程数学教育套件/工具包)【s53-63,各种套件,建筑套件=书+dvd+磁铁组件+益智游戏、MARC记录,编码套件=书+活动组件,电子套件=书+dvd+电子套件】

• 其他非传统物品(仅列名)

Rabun County Public Library: metal detector, game & trail camera, blood pressure monitor/cuff(金属探测器、游戏和跟踪摄像机、血压计/袖带https://www.rabuncountylibrary.org/unconventional-items【非传统单件,可借1周/无续借、10$/天】

Toccoa-Stephens County Library: tabletop telescope, SmartGlobe, Gallery Studio deluxe art set(桌面望远镜、智能地球仪、画廊工作室豪华艺术套装