在MARC中使用URI:URI指导小组最终报告

虽然MARC本身不能直接用于关联数据,但图书馆界所用元数据多由MARC转换,在MARC编目中记录URI,有助于后续的关联数据应用。因此多年前已开始尝试在MARC中使用URI。

MARC书目格式于2007年新增子字段$0规范记录控制号,2016年$0扩大到包括各种标准号,并且在不标注时默认为URI。2017年新增子字段$1真实世界对象URI,区别于作为其描述的$0。当年还新增字段758资源标识符,记录书目记录中描述的资源或与其相关的资源,如FRBR作品、内容表达、载体表现和单件,以$i/$4记录关系,$0/$1记录标识符。

2015年美国合作编目项目PCC开始寻求在MARC中记录URI的最佳实践,其后开展了2项试验:

  • 2019-2021:PCC URIs in MARC Pilot
  • 2020-2021:PCC Wikidata Pilot(在MARC中记录维基数据的URI)

URI指导小组(URI Guidance Subgroup, UGS)属于PCC的关联数据咨询委员会(LDAC)和身份管理咨询委员会(IMAC),应PCC政策委员会(PoCo)要求撰写报告,就如何在书目和规范记录中使用MARC中的URI提供指导,以下是其最终报告:

关联数据咨询委员会/身份管理咨询委员会的URI指导小组给合作编目项目政策委员会的报告 LDAC/IMAC URIs Guidance Subgroup Report to PCC PoCo (March 17, 2023)

报告提出7个建议,以下为摘译【本人注】

  • 建议1【正式做】:正式终止MARC中URI试验,并采取适当措施使编目员能够在MARC记录中插入URI【试验早已结束,现在应该真正做了!】。这将包括审查相关文件以进行任何必要的编辑:政策声明、元数据指导文档、描述性编目手册、LC指南补充、参与者的手册和其他文档。此外,核心的MARC中URI文档应由PCC发布和维护,PCC应就在MARC中插入URI提供指导。…建议的核心汇编在下面的附录C中。
  • 建议2【总则】:公布在MARC中插入URI的项目以及提供指导的PCC小组的总则。…附录G汇编了一些总则。…
  • 建议3【核心文档】:组织关于在MARC中添加URI的核心文档(见附录C),并将其作为集合发布。这可能需要成立一个小组来处理文件以供发布…。流程可能包括…。进一步建议,指导在职编目员的信息应尽可能汇编在一份文件中,可能是按照NACO 024最佳实践指南的最佳实践文件【附录C核心文档 [2]】。
  • 建议4【用例】:在上面提到的同一集合中,记录MARC中URI的用例。关注将URI添加到MARC的用例范围可以帮助我们了解添加这些数据可以实现的各种目标以及它可能产生的影响。此外,培训计划(如以下建议5中所建议的)——如果制定了这些计划——可以包括为什么这项工作很重要,如何使用最终结果,以及它如何影响用户。(下面的附录E是记录用例的开始。)
  • 建议5【培训】:责成培训常设委员会制定培训计划,以便在书目和规范记录的MARC中添加URI。
  • 建议6【政策指导】:要求新的或现有的机构提供政策和实践指导,以回应PCC参与者的问题。……
  • 建议7【调查】:在PCC成员的适当时间进行调查,以衡量MARC中URI用户的进展、发展和态度,并评估未来需要支持的领域。

收录相关资料的8个附录

附录A:小组职责【为MARC书目和规范记录中URI的使用提供指导】

附录B:相关PCC和其他报告、指南和资源【2页】

附录C:核心文档【PCC指导文件6种】

  • [1] MARC object table: a field-by-field analysis of the bibliographic format. (2019)
  • [2] NACO 024 Best Practices Guidelines. (2019-2023)
  • [3] PCC Task Group on Linked Data Best Practices Final Report. (2019)
  • [4] URI FAQs. (2018)
  • [5] Formulating and Obtaining URIs: A Guide to Commonly Used Vocabularies and Reference Sources. (2020)
  • [6] URIs in MARC Cheat Sheet. (2023)

附录D:PoCo对3个PCC试验进展中描述的调查中确定的需求,2021年11月5日,幻灯片10-27页。【调查结果,URI指导小组的意见】

附录E:用例,衍生自:Use Cases for URIs in MARC: Toward Native Linked Data. (2018)【4方面用例:发现,ILS,规范[数据]供应商,走向原生关联数据】

附录F:格式化和获取URI【附录C核心文档 [6]】

附录G:总则

  • 主要来源于PCC MARC中URI工作组(PCC Task Group on URIs in MARC)和PCC应用常设委员会MARC书目记录元数据和实践工作组(PCC Standing Committee on Applications Task Group on Enhancing Metadata and Practices in MARC Bibliographic Records)的报告。
  • 编目员在MARC中输入URI的总则:
  • – 在MARC中嵌入URI的建议/指南必须符合现有MARC环境的成本效益
  • – MARC中的文字值有时很容易在没有$0或$1的情况下转换为URI,因此,在这些情况下,不需要在MARC记录中输入这些URI。
  • – 避免在任务易于自动化的地方手动添加URI。例如,一些软件,如Authority Toolkit,提供了简化URI输入的服务。协调工具(Reconciliation tools),如OpenRefine,允许查找外部数据库中的URI,并将其与数据中存在的实体进行匹配。另一方面,有时使用频率较低的词表,或使用可能不稳定或不唯一标签的来源,被排除在服务之外或难以协调,从而证明使用手动输入是合理的。
  • – 应该注意使用规范的和可解引的URI,而不是简单地使用任何呈现自己的http链接。
  • – MARC本身并不是一种关联数据格式。将URI插入MARC记录主要是为了提高MARC到RDF转换的输出
  • – 注意编目员的时间。
  • PCC小组在MARC中提供URI指导的一般原则:【略】

附录H:时间表,2007-2022【$0、$1、758字段加入MARC及调整;PCC成立工作组/委员会,包括MARC中URI/身份管理/关联数据/为BIBFRAME转换简化MARC/增强MARC书目元数据;试验MARC中URI、Wikidata;等】

元数据评估工具库

DLF Metadata Assessment Working Group — Tools

元数据评估工具库,收录元数据相关工具的信息,包括工具的使用和功能、支持的元数据标准以及工具本身的文档链接。

本工具库将收录的元数据工具分为7个类别:[1]创建、[2]编辑、[3]验证、[4]转换、[5]抽取/嵌入、[6]检索、[7]分析。类别起到过滤器的作用,方便使用者筛选有助于特定工作类别的工具。具有多种功能的工具入多个类别;同时也支持搜索查找。

从类别可知,并非限于“评估”本身。实际上要评估元数据,必然要对元数据进行各种预处理,因此“通常借助于脚本和其他自动化工具”以“更聪明地工作,而不是更努力地工作”。

本工具库由美国数字图书馆联盟(Digital Library Federation,DLF)之评估兴趣组(Assessment Interest Group,AIG) 之元数据工作组(Metadata Working Group,MWG)之元数据评估工具小组(Metadata Assessment Tools subgroup)制作。

项目始于2016年,当时收录21种工具。“在创建工具库的早期,每个工具都经过了严格的测试,以确定是否将其包含在存储库中。这意味着每个工具都有很多信息,但这对包含的工具数量有很大限制。为了包含更多的工具并使存储库成为更有用的资源,小组不再测试每个工具,现在依赖于每个工具的文档和社区知识”。尽管如此,此次更新,工具总数仍不到30种。页面上有链接供提交新工具、更正错误。“我们积极欢迎社区的意见,帮助我们提供有关所列工具的更准确和完整的信息!”

看工具库,既有专业编目软件如MarcEdit,也有通用数据处理插件如Open Refine,甚至还包括更通用的统计分析软件如R

这些工具支持的标准包括:

  • MARC, MODS, EAD, Dublin Core, BIBFRAME
  • IPTC Photo Metadata
  • PBCore, EBUCore
  • Framework for Interoperable Media Services (FIMS)
  • Exif, IPTC (IIM), GPS, TIFF
  • VRA Core
  • RDF

其中支持MARC的工具有:

  • MarcEdit(编辑/转换/验证/检索/分析;同时支持标准:MODS/EAD/Dublin Core)
  • K-Romanizer(韩语罗马化/转换)
  • LibreCat/Catmandu(创建/编辑/转换;同时支持标准:MODS/Dublin Core/RDF)
  • ruby-marc(创建/编辑/转换)
  • MatchMARC(检索)
  • MetadataMaker(创建;同时支持标准MODS/BIBFRAME)

原博文:

音视频和实物编目最佳实践

OLAC近日发布音视频和实物编目最佳实践:

用原RDA工具包和MARC 21编目DVD视频和蓝光光盘、实物、流媒体和视频游戏的最佳实践 OLAC Best Practices for Cataloging DVD-Video and Blu-ray Discs, Objects, Streaming Media, and Video Games Using the Original RDA Toolkit and MARC 21 / Prepared by the Online Audiovisual Catalogers Inc.. Version 1.0, April 2023. 368 pages. https://cornerstone.lib.mnsu.edu/olac-publications/28/

配套全MARC示例 Full MARC Examples to Accompany OLAC Best Practices for Cataloging DVD-Video and Blu-ray Discs, Objects, Streaming Media, and Video Games Using the Original RDA Toolkit and MARC 21. 180 pages. https://cornerstone.lib.mnsu.edu/olac-publications/27/

OLAC全称On-line Audiovisual Catalogers在线视听编目员公司,成立于1980年,是附属于美国图书馆协会(ALA)的非营利性会员组织,为参与或有兴趣创建、维护和发现所有类型非印刷资料(含数字资源、视频和录音、网站、地图、多媒体、图形资料和实物)元数据的人员提供人际网络和资源。

OLAC网站的“资源”版块,提供非印刷资料编目的各种最佳实践与指引,最新的就是综合多个先前文档形成的上述统一版最佳实践。

从文前OLAC编目政策委员会的统一最佳实践工作组致谢看,工作始于2012年、原RDA启用前夜。文档长达368页,可谓十年磨一剑。虽然原RDA已被官方RDA取代,但RDA的变化主要在内容呈现,实践层面的规则并无多少变化,因而本最佳实践并不会过时。另有单独的《配套全MARC示例》,以OCLC编辑格式呈现完整的MARC21记录,即头标与008字段为表格呈现,其它字段为文本呈现,参考性极佳。

如题名所示,本最佳实践包含4种资料格式:

  • DVD视频和蓝光光盘(示例19条记录)
  • 实物(包括教具、玩具、模型、艺术原件、游戏用品、显微镜片、立体模型和触觉三维形式)(示例13条记录)
  • 非音乐流媒体音视频(非音乐流媒体音频示例10条记录,流媒体视频示例19条记录)
  • 视频游戏(示例17条记录)

本最佳实践正文可分为三个部分:

  • 首先是前言、原则、如何使用;
  • 其次具体介绍4种资料格式,特别列出相关资源、编目实践与MARC21的变化、MARC21书目格式的特别字段;
  • 最后是主要部分,以原RDA章节为序、逐个列举说明相关条款。