在MARC中记录URI的核心词表(《NACO 024最佳实践指引》)

合作编目项目(PCC)在2019-2021年开展了两项以MARC记录URI的试验,意在由名称的规范控制走向实体的身份管理。在2023年3月的“URI指导小组最终报告”中,列出了正式开展此项工作的6个核心文档,其中一个核心文档曾在2018年博文中写过其早期版本:[5] Formulating and Obtaining URIs: A Guide to Commonly Used 由Vocabularies and Reference Sources. (2020)。参见:

本文围绕另一个核心文档的最新版本,关于在LC名称规范档(NACO)的MARC 024字段中记录URI的指引:[2] NACO 024 Best Practices Guidelines. (2019-2023)

024字段:其他标准标识符,除ISBN、ISSN等以外的标准号或代码或URI(书目与规范格式相同)

鉴于一条记录中出现过多024字段对用户与本地系统维护造成的麻烦,提出本最佳实践。简单地说,就是规定一般限制每条规范记录最多5个024字段。为此提出“核心词表”,当已有5个或更多时,只有出自“核心词表”的才能添加。

本指引中的核心词表,以表格示例方式,分别列举不同类型实体的来源。概要如下:

  • 个人名称:Wikidata, ISNI, ORCID, VIAF, ULAN, WorldCat Entities
  • 家族名称:VIAF, Wikidata, CERL, ULAN
  • 团体名称:Wikidata, ISNI, VIAF
  • 地理名称:Wikidata, GeoNames, TGN, WorldCat Entities
  • 作品和内容表达:Wikidata, VIAF, MusicBrainz, BBC Things, DBpedia, FAST, WorldCat Entities

虽然这是个要求遵守的政策文件,但此“核心”词表不是强制性的(并且会维护更新)。可以根据机构与馆藏的需要使用任何词表,包括前述[5]中所列词表,需要注意只有前述5个024字段的数量限制。

指引还指出,OCLC Connexion(编目软件)中的Authority Toolkit可用于搜索外部词表,并根据这些词表正确构建URI。

我们编目的酷东西

曾多次在PPT中引用一张Flickr上的照片,一位笑嘻嘻的编目员与一具人体骨架勾肩搭背,标题是“我编目了这个”,用来说明早年的编目规则就面向广泛的编目对象。

2021年秋,美国图书馆协会(ALA)大学和研究图书馆协会(ACRL)珍本和手稿部门(RBMS)书目标准委员首次举办短演讲网会“我们编目的酷东西”(Cool Things We Cataloged),演讲者介绍经手过的令人难忘的编目对象,特别强调在为不同寻常的古物提供描述和检索点方面,用来解谜和应对挑战的各种工具和技能。

今年是短演讲网会的第3年,目前正在征集演讲者,会长约1小时、每个演讲7-10分钟,9月15日报名截止:

CFP: “Cool Things We Cataloged” Fall Webinar (Due 9/15/23)

我们正在寻找各种各样的演讲者(编目员、档案管理员、辅助专业人员、学生、实习生等)。如果你已经编目了你认为很酷的东西,那么可以考虑演讲。这些物品可能是图书、地图、地球仪、厨房用具、园艺工具、教育工具包、乐谱或其他任何东西。演讲者将讨论为什么一个对象或一组对象对编目来说是一个挑战,他们是如何编目的,他们用来编目的资源(如内容标准),以及他们在编目时学到的信息。

看看前两年报告都有些什么酷东西?似乎主要是特藏:

2021年短演讲会PPT:Cool Things We’ve Cataloged – September 2021. URI: http://hdl.handle.net/11213/16711

• Kaydian Campbell: “Mayrent Collection of Yiddish recordings”(Mayrent意第绪语录音集)【s3-19,收藏概况,访问网址https://search.library.wisc.edu/digital/AMayrentRec,唱片展示,编目者,编目方式(元数据=DC到MODS到MARC、自动化=Ruby编程+shell脚本、资源…),规范控制,参与团队,联系方式】

• Julie Christenson: “Cataloging the Jewish Diaspora: The I.O. Lehman Collection at Texas Christian University”(犹太侨民编目:德克萨斯基督教大学的I.O.Lehman收藏)【s20-38,收藏概况/语种、年代,…】

• Anna M. Ferris: “Cataloging Nuremberg Trial Proceedings in the Harry W. Mazal Holocaust Collection”(Harry W.Mazal大屠杀收藏中纽伦堡审判录的编目)【s39-46,合订,检索策略=人名+LC分类号】

• Felicia A. Piscitelli: “Without a Title Page, Preliminaries, or a Colophon: or, the Cataloger as Detective”(没有题名页、文前序页或版权页:或者,编目员当侦探)【s48-57】

• Naomi Shiraishi: “Japanese Historical Maps”(日本历史地图)【s58-70,Mitsui收藏中的地图收藏2000件,伯克利图书馆-数字收藏-日本历史地图】

• Amanda K. Sprochi: “15th-century Mamluk Qur’an”(15世纪马穆鲁克古兰经)【s71-80,书影,参考资料】

2022年短演讲会PPT:Cool Things We’ve Cataloged – October 2022. URI: http://hdl.handle.net/11213/19165

• Amy Swanson: A Widow’s Plea in 17th Century Spain(17世纪西班牙一位寡妇的恳求)【s3-11,1641年34页西班牙语印刷本。如何克服西班牙语障碍,解码家族树,完成MARC记录,参考书目】

• Geanna M. Hernandez-Phan: Variants of Erle Stanley Gardner’s novels(Erle Stanley Gardner小说的变体)【s12-25,不同版本记录的强化过程】

• Kim Schwenk: Gato Negro Ediciones, Or, how to start a class(ification) war(黑猫版,或者,如何发动分类战争)【s26-44,黑猫版,Risograph [一种彩色印刷方式,s31有详细介绍],墨西哥2013-2021年西英双语,当代艺术展出版物,MARC记录,编目体会】

• Leia Lynn: Ace Double Novels(Ace双面小说)【s46-52,Ace Books在1950-1970年间出版的双向倒印小说,MARC记录】

• Linh Uong: s.t.e.m. kits(stem(科学技术工程数学教育套件/工具包)【s53-63,各种套件,建筑套件=书+dvd+磁铁组件+益智游戏、MARC记录,编码套件=书+活动组件,电子套件=书+dvd+电子套件】

• 其他非传统物品(仅列名)

Rabun County Public Library: metal detector, game & trail camera, blood pressure monitor/cuff(金属探测器、游戏和跟踪摄像机、血压计/袖带https://www.rabuncountylibrary.org/unconventional-items【非传统单件,可借1周/无续借、10$/天】

Toccoa-Stephens County Library: tabletop telescope, SmartGlobe, Gallery Studio deluxe art set(桌面望远镜、智能地球仪、画廊工作室豪华艺术套装

在MARC中使用URI:URI指导小组最终报告

虽然MARC本身不能直接用于关联数据,但图书馆界所用元数据多由MARC转换,在MARC编目中记录URI,有助于后续的关联数据应用。因此多年前已开始尝试在MARC中使用URI。

MARC书目格式于2007年新增子字段$0规范记录控制号,2016年$0扩大到包括各种标准号,并且在不标注时默认为URI。2017年新增子字段$1真实世界对象URI,区别于作为其描述的$0。当年还新增字段758资源标识符,记录书目记录中描述的资源或与其相关的资源,如FRBR作品、内容表达、载体表现和单件,以$i/$4记录关系,$0/$1记录标识符。

2015年美国合作编目项目PCC开始寻求在MARC中记录URI的最佳实践,其后开展了2项试验:

  • 2019-2021:PCC URIs in MARC Pilot
  • 2020-2021:PCC Wikidata Pilot(在MARC中记录维基数据的URI)

URI指导小组(URI Guidance Subgroup, UGS)属于PCC的关联数据咨询委员会(LDAC)和身份管理咨询委员会(IMAC),应PCC政策委员会(PoCo)要求撰写报告,就如何在书目和规范记录中使用MARC中的URI提供指导,以下是其最终报告:

关联数据咨询委员会/身份管理咨询委员会的URI指导小组给合作编目项目政策委员会的报告 LDAC/IMAC URIs Guidance Subgroup Report to PCC PoCo (March 17, 2023)

报告提出7个建议,以下为摘译【本人注】

  • 建议1【正式做】:正式终止MARC中URI试验,并采取适当措施使编目员能够在MARC记录中插入URI【试验早已结束,现在应该真正做了!】。这将包括审查相关文件以进行任何必要的编辑:政策声明、元数据指导文档、描述性编目手册、LC指南补充、参与者的手册和其他文档。此外,核心的MARC中URI文档应由PCC发布和维护,PCC应就在MARC中插入URI提供指导。…建议的核心汇编在下面的附录C中。
  • 建议2【总则】:公布在MARC中插入URI的项目以及提供指导的PCC小组的总则。…附录G汇编了一些总则。…
  • 建议3【核心文档】:组织关于在MARC中添加URI的核心文档(见附录C),并将其作为集合发布。这可能需要成立一个小组来处理文件以供发布…。流程可能包括…。进一步建议,指导在职编目员的信息应尽可能汇编在一份文件中,可能是按照NACO 024最佳实践指南的最佳实践文件【附录C核心文档 [2]】。
  • 建议4【用例】:在上面提到的同一集合中,记录MARC中URI的用例。关注将URI添加到MARC的用例范围可以帮助我们了解添加这些数据可以实现的各种目标以及它可能产生的影响。此外,培训计划(如以下建议5中所建议的)——如果制定了这些计划——可以包括为什么这项工作很重要,如何使用最终结果,以及它如何影响用户。(下面的附录E是记录用例的开始。)
  • 建议5【培训】:责成培训常设委员会制定培训计划,以便在书目和规范记录的MARC中添加URI。
  • 建议6【政策指导】:要求新的或现有的机构提供政策和实践指导,以回应PCC参与者的问题。……
  • 建议7【调查】:在PCC成员的适当时间进行调查,以衡量MARC中URI用户的进展、发展和态度,并评估未来需要支持的领域。

收录相关资料的8个附录

附录A:小组职责【为MARC书目和规范记录中URI的使用提供指导】

附录B:相关PCC和其他报告、指南和资源【2页】

附录C:核心文档【PCC指导文件6种】

  • [1] MARC object table: a field-by-field analysis of the bibliographic format. (2019)
  • [2] NACO 024 Best Practices Guidelines. (2019-2023)
  • [3] PCC Task Group on Linked Data Best Practices Final Report. (2019)
  • [4] URI FAQs. (2018)
  • [5] Formulating and Obtaining URIs: A Guide to Commonly Used Vocabularies and Reference Sources. (2020)
  • [6] URIs in MARC Cheat Sheet. (2023)

附录D:PoCo对3个PCC试验进展中描述的调查中确定的需求,2021年11月5日,幻灯片10-27页。【调查结果,URI指导小组的意见】

附录E:用例,衍生自:Use Cases for URIs in MARC: Toward Native Linked Data. (2018)【4方面用例:发现,ILS,规范[数据]供应商,走向原生关联数据】

附录F:格式化和获取URI【附录C核心文档 [6]】

附录G:总则

  • 主要来源于PCC MARC中URI工作组(PCC Task Group on URIs in MARC)和PCC应用常设委员会MARC书目记录元数据和实践工作组(PCC Standing Committee on Applications Task Group on Enhancing Metadata and Practices in MARC Bibliographic Records)的报告。
  • 编目员在MARC中输入URI的总则:
  • – 在MARC中嵌入URI的建议/指南必须符合现有MARC环境的成本效益
  • – MARC中的文字值有时很容易在没有$0或$1的情况下转换为URI,因此,在这些情况下,不需要在MARC记录中输入这些URI。
  • – 避免在任务易于自动化的地方手动添加URI。例如,一些软件,如Authority Toolkit,提供了简化URI输入的服务。协调工具(Reconciliation tools),如OpenRefine,允许查找外部数据库中的URI,并将其与数据中存在的实体进行匹配。另一方面,有时使用频率较低的词表,或使用可能不稳定或不唯一标签的来源,被排除在服务之外或难以协调,从而证明使用手动输入是合理的。
  • – 应该注意使用规范的和可解引的URI,而不是简单地使用任何呈现自己的http链接。
  • – MARC本身并不是一种关联数据格式。将URI插入MARC记录主要是为了提高MARC到RDF转换的输出
  • – 注意编目员的时间。
  • PCC小组在MARC中提供URI指导的一般原则:【略】

附录H:时间表,2007-2022【$0、$1、758字段加入MARC及调整;PCC成立工作组/委员会,包括MARC中URI/身份管理/关联数据/为BIBFRAME转换简化MARC/增强MARC书目元数据;试验MARC中URI、Wikidata;等】