为BIBFRAME转换简化MARC格式

美国国会图书馆(LC)实施BIBFRAME已是箭在弦上,届时它将不再以MARC进行编目,代之以提供由BIBFRAME转换生成的MARC记录。为此,合作编目项目(PCC)于2022年初成立“BIBFRAME转换之MARC简化专责组”,其职责是检查LC的BIBFRAME2.0到MARC21转换程序和相关规范,据此开发一套简化的MARC字段,以准确有效支持BIBFRAME转换。年中和年末,中期报告和最终报告如期完成发布。见:

这套简化字段,在职责文件中称“瘦MARC”(Skinny MARC)。出于词义褒贬原因,小组先后考虑过一些其他术语,包括:简化MARC(simplified MARC)、基本MARC(essential MARC)BF2MARC用于BIBFRAME的MARC改编(MARC adaptation for BIBFRAME)链接MARC(linky MARC)。特别说明的是,需要与先前的“轻量级MARC”(MARC 21 LITE, 2008版)区别开来。小组称不推崇任何上述名称,但或许是出于表述简单的考虑,在最终报告中多用“BF2MARC”。

小组提出的BF到MARC字段表,称为“来自BIBFRAME的MARC描述性字段的初步曲目”(Preliminary Repertoire of MARC Descriptive Fields from BIBFRAME)。所谓“初步”,是因为提供的2个表格中,主表“MARC<-BF”只有90多个变长字段子字段(如020$a)或定长字段位置段(如008/07-10),其中还包括12个无对应的008字段位置段,实际有对应的只有80多对。副表“MARC not included”列出没有对应BIBFRAME元素的近130个子字段等(如130/240$a)。可以想见这离成品有多大距离,LC的BF/MARC转换已历多年,我原本以为据此提出一套简化MARC格式是件并不复杂的任务,如此结果真是出乎意料。

为此,最终报告概述首先指出:“我们团队认识到,当前的BIBFRAME环境还不够成熟,无法建立稳定可靠的MARC字段集以作为永久‘简化’集”。之后列举了小组工作的复杂性(摘录)【本人理解】:

  • LC 转换记录的可得性缺乏【LC没提供】
  • 同行示例的通行性缺乏【于是从开发Sinopia的[LD4]获取,但数据滞后于LC目前用的BF2.2,也没有用LC本地扩展bflc:】
  • 书目记录中罗马化的未来不确定性【LC4调查显示罗马化对图书馆运行与服务很重要,但LC更倾向于使用有限罗马化文字;亲历LC的BF到MARC转换在使用/不使用880字段间摇摆】
  • LC的BIBFRAME扩展(bflc) 的状态【主要款目在BF中没有对应物,只在扩展bflc:;BF新类Hub与240字段的关系】
  • 序列化MARC数据的不确定性【检索点1XX/6XX/7XX/8XX中不同子字段,对规范维护的影响】
  • 小组对专业格式的专业知识的限制

接着提出了9个希望PCC未来讨论的开放主题【略】

附录2,BIBFRAME到MARC 21(BF2MARC)转换原则和量规(摘录):

1、BF2MARC记录看起来将不像原生MARC【包括只带最少的ISBD标点淡化主要款目,但包含关系代码;可能用040或884字段中的代码标识转换生成的记录】

2、BF2MARC记录虽然不一定复制惯用的MARC技术或惯例,但仍应像传统MARC记录一样发挥作用,支持以下领域的基本机器和人类操作:a.提供所描述资源的明确标识;b.提供所描述资源的必要描述性细节;c.启用对书目检索点的受控检索;d.为书目检索点的存在提供合理的理由【附注】;e.启用对主题检索点的受控主题检索;f.提供足够的元数据出处以实现信任和管理。【这是小组的意见,更从涉及编目规则,LC是否认可?】

3、转换必然是一个有损的过程。BF2MARC数据的功能要求不是可以通过算法将其转换回BIBFRAME。

4、应允许并鼓励对BF2MARC记录进行后续的下游修改。

Sinolio=集成FOLIO和Sinoipa编辑器

在2021年第5届欧洲BIBFRAME研讨会(BIBFRAME Workshop in Europe 2021)上,有2个关于FOLIO和Sinoipa编辑器的报告:

Sinopia是LD4P项目的RDF编辑器,可以BIBFRAME和其他本体进行编目,最初基于美国国会图书馆BIBFRAME编辑器。有关这两个编辑器,可参见本次会议的另一个报告:两个编辑器的故事(A tale of two editors

关于Sinolio的报告在会议网站上仅有简介:开源关联数据编辑器Sinopia正在探索2021年秋季的FOLIO集成。这项工作非正式地称为 Sinolio(Sinopia 和 FOLIO 的组合),重点将放在API级与像BIBFRAME这样的Sinopia资源集成在FOLIO Inventory的馆藏、实例和单件中具有代表性的作品、实例和单件。

关于Sinopia和FOLIO的报告也包含Sinolio的一些信息,摘译如下:

作为安德鲁W.梅隆基金支持的LD4P3(闭环) 项目的一部分,康奈尔大学和斯坦福大学正在探索将Sinopia RDF编辑器与FOLIO开源图书馆服务平台集成的工作。概念整合证明将允许实施FOLIO的图书馆使用Sinopia为其部分馆藏提供丰富的书目描述,同时继续将MARC用于其他项目。RDF数据将存储在Sinopia中,同时也在FOLIO Inventory中存储足够的数据,以允许Sinopia中描述的资料的收集管理和流通。这种集成将是使RDF成为图书馆编目主流部分的重要一步,有助于将关联数据编织到日常图书馆工作流程中,并弥合MARC和LOD(关联开放数据)世界之间的差距。
康奈尔大学2021年7月全面实施 FOLIO。FOLIO本身没有RDF编目工具,FOLIO+Sinopia=用 BIBFRAME维护其目录部分的路径,无需单独的系统或额外的操作记录。Sinopia将提供BIBFRAME存储与编辑。Sinopia+FOLIO=Sinolio。Sinolio ETL(抽取、转换、加载)工作流程:i. 从Sinopia中提取RDF,ii. 转换为FOLIO典藏记录,iii. 通过Okapi API加载。

Sinopia编辑器可注册试用:stage.sinopia.io

参见:2021欧洲BIBFRAME研讨会信息(2021-10-17)

Share-VDE在图书馆关联开放数据中的作用

【Share-VDE的前世今生】

Share-VDE始于2016年。

2017年,意大利@CULT公司在BIBFRAME 2.0实施注册(BIBFRAME 2.0 Implementation Register)中添加了其开发的7所大学的目录门户:SHARE — Scholarly Heritage and Access to Research,包含200万书目记录、34万规范记录,采用BIBFRAME词表的关联数据发布。以FRBR化目录界面,呈现作者的增强信息。参见:BFRAME 2.0实施注册新增项目(附:意大利SHARE目录)(2017-7-25)

2018年BIBFRAME更新论坛,Casalini Libri(书目和规范数据提供者,PCC成员)、@Cult(ILS、发现工具、语义网解决方案厂商)介绍其与16个北美研究图书馆合作的Share-VDE项目(https://share-vde.org),用URI强化MARC记录。目录界面与SHARE相同,只是收录内容不同吧。参见:2018年BIBFRAME更新论坛(2018-11-14)

2019年初BIBFRAME更新论坛,斯坦福大学介绍LD4P2项目使用SHARE-VDE转换记录为BIBFRAME。参见:ALA 2019仲冬会议的BIBFRAME更新论坛(2019-2-17)

2020年LD4P3项目,Share-VDE作为托管编目环境,成为项目重要的协作者。LD4系列项目至此“闭环”,意在关联数据环境下创建一个完整周期的工作模型,进行图书馆元数据的创建、共享和重用。参见:关联数据编目走向现实——新项目LD4P3及LD4社区(2020-12-10)

2021年9月第5届欧洲BIBFRAME研讨会,公司介绍技术上重构的Share-VDE 2.0(https://svde.org/)。参见:2021欧洲BIBFRAME研讨会信息 (2021-10-17)

【Share-VDE声明】

与此同时,Share-VDE咨询委员发布了一个声明,描述该计划在图书馆关联开放数据的更广泛背景下的作用,内容包括SVDE概述、数据模型、LOD、PCC数据池、工具和发现(以下为谷歌翻译,仅少量人工干预,如链接数据->关联数据)

Share-VDE在图书馆关联开放数据中的作用(Share-VDE’s Role in Library Linked Open Data

概述

Share-VDE(虚拟发现环境)项目自 2016 年最初的 Share-VDE 原型以来一直是图书馆关联开放数据和 BIBFRAME 使用的领导者。 通过汇集来自欧洲和北美许多图书馆的数据,Share-VDE在异构环境中展示了 BIBFRAME 的强大功能。 Share-VDE 植根于美国国会图书馆开发的 BIBFRAME 数据模型,但扩展到来自许多图书馆的图书馆数据,显示了合作的力量。成员图书馆与 Casalini 和 @Cult 的开发团队合作,贡献了他们的数据、时间和资源来开发 Share-VDE。

数据模型

作为图书馆生态系统中的 BIBFRAME 节点,Share-VDE 提供丰富的数据,可与其他 BIBFRAME 节点互操作。 Share-VDE 将来自成员图书馆的 MARC 规范和书目数据汇集在一起,用权威实体对其进行丰富,并将数据聚类到 BIBFRAME 实体中。 Share-VDE 工作组详细审查了聚类,并扩展了 BIBFRAME 模型以满足现实世界的需求并反映参与图书馆的数据。数据模型的这种发展产生了 Share-VDE Opus(一种 bf:Work),它将所有相关内容表达组合或聚集在一起并代表原始/创造性作品,从而促进与 IFLA LRM 的互操作性。

关联的开放数据

Share-VDE 基础设施基于 LOD 平台,该平台旨在能够自动化创建和发布关联开放数据的过程,而不管数据源格式如何。 Sapientia 集群知识库在 RDF(因此作为关联开放数据)中可用,并可通过 SPARQL 端点和 API 查询访问。

PCC数据池

基于这项开发工作,Share-VDE 被 LD4P3 基金选中来创建 PCC 数据池。 Share-VDE 与 LD4P、OCLC 和 PCC 合作,将所有 BIBCO 和 Conser MARC 编目整合在一起。 Share-VDE 数据模型和聚类算法被应用于创建 PCC 质量 BIBFRAME 数据的开放池。 PCC 数据池将作为编目员使用 Sinopia 创建本地生产的 BIBFRAME 的可信数据源,以及任何用户都可以使用的关联开放数据。

工具

除了其他开发工作之外,Share-VDE 团队还在创建工具来处理数据。 Share-VDE 数据模型预计,在大量自动化实体集群中,某些集群或关系链接将不准确。 J.Cricket 编辑器提供了一种将直接用户专业知识应用于维护 Sapientia 集群知识库的方法。成员图书馆与开发团队也一直在探索和推荐外部数据源,以将其合并到为集群知识库提供数据的规范数据流中。此外,他们正在研究新的规范工具和服务,以与 BIBFRAME 模型保持一致并扩大规范数据的使用。

发现

最后,Share-VDE 带来了许多其他 BIBFRAME 项目所缺少的关键元素——发现。正如 Share-VDE 名称所示,Discovery 从一开始就是该项目的重点。 Share-VDE 发现基于 BIBFRAME,使用实体模型。与基于记录的目录不同,Share-VDE 侧重于作品和作者元素。这种新模型通过专注于原始作品而不是单个图书馆中的特定实例,避免了基于 MARC 的目录中存在明显重复记录的长期问题。这种方法超越了关联数据的丰富(例如数据卡),成为了一种新的发现方法。这是对 BIBFRAME 生态系统的一个巨大补充,展示了关联数据改善用户体验的力量。

总结

Share-VDE 是一个 BIBFRAME 节点,在新兴的书目生态系统中提供可与图书馆和其他 BIBFRAME 节点交换的权威数据。数据模型和工具是由一个强大的合作社区开发的。 Share-VDE 计划是该生态系统的领导者,并支持最终目标:促进丰富和结构化数据的重用,并为研究社区提供新一代获取知识的工具。