法国图书馆界的关联数据之路(BnF vs Abes)

2023年9月召开的欧洲BIBFRAME研讨会,相关/社区报告(非BIBFRAME应用)只有一个,关于法国和国际图书馆的两种不同的关联数据路径,介绍6月完成的一项研究,由法国高等教育书目机构(Abes)委托一家咨询公司所做:

走向关联数据之路 En route to Linked Data: A study for Abes / Maurits van der Graaf (Pleiade Management & Consultancy). 8s.

会议PPT仅8张,是一个很好的概述。概言之,在书目向关联数据的转换上,法国与国际路线不同,格式不采用BIBFRAME,编目规则不采用原RDA/新RDA,而是使用RDA-FR(法国版RDA)。

法国的书目转换(Tb, Transition bibliographique)由法国国家图书馆(BnF)和法国高等教育书目机构(Abes)共同推动。在格式上,两家有所不同 :

  • BnF是所有非高等教育图书馆的书目机构,内部格式Intermarc(正开发新一代Intermarc-NG),交换格式Unimarc;
  • Abes是所有高等教育图书馆的书目机构、有200多个高校图书馆参与,管理共享编目系统SUDOC,交换格式Unimarc(及Marc21),准备升级到实体关系的UNIMARC-ER。

所介绍的研究报告共57页,有5页英文摘要:

书目转换对高等教育图书馆的实际影响 LES IMPLICATIONS PRATIQUES DE LA TRANSITION BIBLIOGRAPHIQUE POUR LES BIBLIOTHÈQUES D’ESR / Maurits van der Graaf; Pleiade Management et Consultancy. 27 juin 2023.

报告研究对三方面代表进行了访谈:国际图书馆和国际图书馆组织(关于RDA),图书馆管理系统供应商、图书供应商和出版商,法国图书馆代表。有美国国会图书馆(LC)、瑞典Libris XL、芬兰Melinda两个共享编目系统(后者开发中)、Share-VDE、OCLC/WorldCat与BIBFRAME/关联数据相关的介绍。

有关Abes实施书目转换的时间,文中称:Sudoc的准备阶段将持续4至6年,各校图书馆的转换阶段可能持续8至12年。这表明法国高等教育部门的横向转型可能在2040年左右完成。

不久前法国的书目战略委员会(CSB)给出了执行时间表。可参见:

另可回顾十年前的法国看法及其发布的关联开放数据:

JCricket实体编辑器

2023年欧洲BIBFRAME研讨会(BIBFRAME Workshop in Europe 2023)上,Share-VDE(以下简称SVDE)有2个报告,其一介绍Share-VDE本体(可参见博文:Share-VDE本体:BIBFRAME扩展 ),另一介绍其在生产方面的进展,后半部分演示新推出的实体编辑器JCricket,即规范数据编辑工具。

JCricket用于人工编辑SVDE知识库中的实体(包括其属性、关系、链接等),可用操作包括:

  • 编辑:属性添加、升级、删除
  • 合并:多个棱镜[实体]合并为一个。如“Mark Twain”[笔名]和“Samuel Clemens”[原名]
  • 分拆:一个棱镜[实体]分拆为多个。当一个棱镜错误地包含属于多个实体的信息。如“Wallace David”和“David Wallace”

JCricket是什么

  • 一个关联数据实体/规范编辑器;
  • 适用于在Share家族(svde.orgpcc-lod.orgnatbib-lod.org)的所有租户内创建的关联数据实体;
  • 一个手动应用程序,用于管理CKB集群知识库中实体的属性(特性、关系和链接);
  • 一个跨成员机构共享的协作工具;
  • 可以成为关联开放数据中实体共享的新工具。

JCricket不是什么

  • 不是传统的书目数据编辑器;
  • 不是原始编目工具;
  • 不与Sinopia或Marva对比;
  • 不影响成员馆系统中的原始数据(除非图书馆希望在SVDE及其系统中使用特殊API进行实体更新)

附相关/专有名词:

  • JCricket(曾称 J. Cricket):SVDE的实体编辑器
  • Sapientia(智慧):Share-VDE的知识库(CKB, Cluster Knowledge Base)
  • Tenant(租户):代表一组为同一知识库做出贡献的机构。
  • Provenance(出处):为CKB贡献的具体机构(图书馆)
  • Prism(棱镜):CKB中的实体,(如同多棱镜) 每个面(face)代表数据来自一个给定出处。

来自:

增强MARC书目记录中元数据(SCA工作组最终报告)

最近十多年,针对关联数据在图书馆中的应用,MARC21标准经过多轮扫描更新,其中最重要的变化就是在越来越多的字段中加入控制子字段、记录可解引到RDF的URI,用于增强MARC记录:

  • 2016年重新描述$0规范记录控制号或标准号,取消可解引URI的前缀代码(URI)(其他号码仍需前缀);
  • 2017年新增$1真实世界对象URI。

字段加入URI子字段$0$1,从检索点及代码开始,现在进入到描述性字段。近日合作编目项目(PCC)上线新的报告:

《增强MARC书目记录中元数据和实践的SCA(应用常务委员会)工作组最终报告》Final Report of the SCA Task Group on Enhancing Metadata and Practices in MARC Bibliographic Records. 2023-1-17

报告2023-1-17完成,2023-5-11政策委员会(PoCo)评审,2023-8-31批准了报告建议的10个字段中的8个,预计将体现在MARC标准的后续更新中。

报告审查了82个字段,在非结构化文本中识别出实体,对其中10个描述性字段提出建议。建议包括增加$0和$1子字段,以及对当前政策(即现行编目指导文件)的修订。当前政策引用的现行编目指导文件主要是:

  • 原RDA和官方RDA,主要讨论其中的LC-PCC PS(政策声明)
  • MGD(元数据指导文档)
  • 341字段还引用3种OLAC最佳实践:OLAC Best Practices for Cataloging Objects Using RDA and MARC21,OLAC Best Practices for Cataloging Streaming Media,OLAC Best Practices for Cataloging DVD-Video and Blu-Ray Discs
  • 506和540字段还引用:Provider Neutral E-Resource Guidelines

附录A对10个描述性字段的建议,概要如下(其中7个添加$0$1,5个得到批准/其中1个MARC标准已更新)

  • 024 – Other Standard Identifier (R) 其他标准标识符【添加$0$1,更新GMD】
  • 210 – Abbreviated Title (R) 缩略题名【添加$0$1,创建PS+更新MGD(建议未批准:PCC CONSER试点小组或美国ISSN中心不建议实施210字段)】
  • 300 – Physical Description (R) 物理描述【更新PS+创建MGD】
  • 341 – Accessibility Content (R) 可访问性/辅助内容【添加$0$1,添加$2+创建无障碍词表+来源代码,创建PS+更新MGD】
  • 504 – Bibliography, Etc. Note (R) 书目等附注【推荐使用353字段/辅助内容特征,更改PS+MGD/使用受控词表=补充内容代码】
  • 506 – Restrictions On Access Note (R) 访问限制附注【添加$0$1,更新术语来源代码,创建PS+更新MGD/鼓励使用856$l(建议未批准:出于相同目的已经存在856$l)】
  • 536 – Funding Information Note (R) 资助信息附注【确定各种资助号是否有可用URI;710记录资助者】
  • 540 – Terms Governing Use And Reproduction Note (R) 管理使用和复制条款附注【添加$0$1,更新访问限制条款来源代码表,创建PS+更新MGD/使用856r(与506近似但被接受)
  • 586 – Awards Note (R) 奖项附注【添加$0$1,结构化/添加$c奖项类别$d奖项日期,创建PS+更新MGD】
  • 658 – Index Term–Curriculum Objective (R) 索引词—课程目标【添加$0$1(文中所引MARC讨论稿已批准/MARC标准2023-6-21已更新)】

工作组的8条原则:

  • 1.尊重并肯定先前PCC工作组关于描述性字段的建议。
  • 2.在考虑是否以及如何将描述性字段适用于关联数据时,注意编目员时间和资源的投资回报。
  • 3.在评估拟议的实践变更时,考虑回溯协调(reconciliation)的必要性,以及此类协调所需的资源。
  • 4.评估MARC字段是否明确地传达了单个对象引用。
  • 5.请记住,并非所有URL/URI都可以用于关联数据;关联数据需要一个可以解引到RDF中的URI。
  • 6.保持在工作组根据职责确定的范围内。
  • 7.具有明确标识的词表的字段值可以机械地转换为关联数据,而不必要求编目员在MARC数据中嵌入子字段$0或$1 URI。
  • 8.当数据在记录中其他地方的机器可读字段中复制时,人类可读字段不需要适应关联数据,这些字段可以更容易地用于关联数据。

可以看到对工作效率的重视。而附录B(增强现有描述性字段的工具和策略)更是针对以上每个字段,提出各自使用软件工具识别或批量更新的建议。

参见:在MARC中使用URI:URI指导小组最终报告(2023-8-29)