MARC转换到BIBFRAME的愚人节公告

四月的上海,可以说整月都是愚人节【COVID-19】。所以,现在发这个愚人节故事似乎也不算太晚。

4月1日那天,Jeffrey Edmunds在BIBFRAME邮件组发帖“MARC转换到BIBFRAME”。文中可见对此一趋势的不满,对小型图书馆被抛弃的无奈。也提到相关的重要机构LC和OCLC,在MARC及其转向关联数据过程中有重要影响的人物Terry Reese、Roy Tennant和Lorcan Dempsey,重要的编目软件Connexion、MarcEdit和Sinopia。

MARC –> BIBFRAME transition(全文翻译如下)

即时发布

美国国会图书馆今天宣布,自2022年7月1日起,所有LC系统将从MARC转换为BIBFRAME。

  • MARC记录将不再由LC创建或从LC获得
  • 现有的书目记录将以RDF三元组被原子化、存储及提供
  • 所有LC发现工具的搜索结果都将呈现为知识图谱而不是列表

在LC宣布的同时,OCLC公布了将WorldCat从基于MARC的数据库转变为基于BIBFRAME的三元组存储的计划。OCLC的编目客户端Connexion将于2022年7月1日停用,并由Sinopia取代,以允许OCLC成员以BIBFRAME本地创建和管理书目元数据。

BIBFRAME和关联数据倡导者称赞该公告是十多年发展的顶峰。高级图书馆管理者April Fisch说:“通过这一公告,我们看到了数千小时工作和数百万美元投资的成果。现在,当用户搜索我们系统之一时,他们将看到的不是一个无聊的可用资源列表,而是一些漂亮的东西,比如知识卡和指向其他事物的链接,以及更多指向其他事物的其他事物的链接,以及更多指向其他链接的链接带有更多链接的信息和链接。旨在将用户与资源联系起来的传统图书馆发现系统已经过时。这些新系统将把用户与一切联系起来,我相信我们会同意,这更酷。”

Roy Tennant,二十年前他的心声:“MARC必须死!”终于被听到了,大喜过望。 “终于!”据报道,他明显松了一口气。 “我开始以为MARC可能永远不会死!” (另一方面,MarcEdit的创建者和ALCTS编目和元数据管理部门颁发的2019年Margaret Mann奖获得者Terry Reese沮丧地在俄亥俄州立大学校园内蹒跚而行,喃喃自语“现在怎么办?” )

Lorcan Dempsey著名地观察到“发现发生在别处”。由于BIBFRAME完全放弃了MARC,发现现在将无处不在,即使用户无法判断它正在发生。

BIBFRAME 和关联数据长期承诺的极大改善的用户体验现在将成为现实。新系统不再回答诸如“我在哪里可以买到这本书?”之类的无聊问题,而是允许用户形成诸如“向我展示生活在18世纪并在莱比锡出版的名叫玛丽亚的德国女作家的所有资料”之类的查询。或者柏林、还有谁有红头发、或棕色、还有一只名叫基普的腊肠犬。”

当被问及资源较少且现场技术专业知识较少的小型图书馆如何应对巨变时,LC政策和标准部的一位发言人发表了以下声明:

“嗯,不确定。”

LC目录查BIBFRAME转换记录无果

今年年中看到BIBFRAME更新论坛又讲到“BIBFRAME 100”,即美国国会图书馆(LC)去年有100名编目员、每周2天、以BIBFRAME编目,2021年起改为全部350名编目员、每周5天、以BIBFRAME编目,并且不再做MARC记录,此100仍100%之意。

计算一下:350人*5天*25周/半年=43750人天

假定每人每天做3种,就会有13万条BIBFRAME记录,即使少至1种、也该有4万条以上。

由于LC并未更换系统,因此其目录中的新增记录应该都是由BIBFRAME转换而来的MARC记录。这些记录长什么样?是不是和BIBFRAME到MARC转换界面看到的一样?于是想查一下。

在BIBFRAME到MARC转换中,转换而成的MARC记录中有884字段(2015年新增),形如:

884 $aDLC bibframe2marc v1.1.0-SNAPSHOT $g20210619231058.0 $qDLC $uhttps://github.com/lcnetdev/bibframe2marc

用LC目录的专家搜索查这个特征,是不是可以找出来由BIBFRAME转换而来的记录呢?
于是到LC目录:

一、关键词搜索(专家搜索)Keyword Search (Expert) https://catalog.loc.gov/vwebv/searchKeyword

  • 884A bibframe2marc(Your search could not be processed as entered.)
  • K884 bibframe2marc(Your search could not be processed as entered.)
  • 说明884不可查。

二、再看搜索帮助:Search/Browse Help — Keyword Bibliographic Index Configurations https://catalog.loc.gov/vwebv/ui/en_US/htdocs/help/index_keyword.html

三、是真没有,还是查不到?再试着查2021年或2020年编制的记录(LCCN以2021或2020起始)。

  • 高级搜索,选择途径LCCN:
  • 2021(Your search found no results.)
  • 2020:2条(分别是010=2020,显然有误;010=2020938908)
  • 查其他年份,没有结果——结论:LCCN只能完全一致检索(2020年那条能搜索到的原因不明)

四、再查2021或2020年出版文献(008字段第1出版年),专家搜索:

  • 008D 2021(大多在版编目记录,有263字段计划出版日期)
  • 008D 2020(大多在版编目记录,有263字段计划出版日期;今天查在版编目记录明显减少)
  • 记录005或008字段显示2021年的,均未看到884转换字段。
  • 放弃。

今天与同行讨论此事,想起当初(2021-7-8)所写上述内容,放出。

个人猜测,LC当前的自动化系统在导入由BIBFRAME转换而成的MARC记录时,屏蔽了884字段,导致字段信息丢失?

参见:

LC联机目录的“专家搜索”(2015-10-6)

BIBFRAME/MARC数据双向转换程序更新(880字段消失)(2021-6-20)

884字段:描述转换信息(2015新增)https://www.loc.gov/marc/bibliographic/bd884.html

  • $a – Conversion process (NR) 转换处理(如: DLC bibframe2marc v1.1.0-SNAPSHOT)
  • $g – Conversion date (NR) 转换日期(yyyymmddhhmmss.X,如:20210619231058.0)
  • $k – Identifier of source metadata (NR) 来源元数据标识符
  • $q – Conversion agency (NR) 转换机构
  • $u – Uniform Resource Identifier (R) [转换程序]URI(如:https://github.com/lcnetdev/bibframe2marc)

Share-VDE在图书馆关联开放数据中的作用

【Share-VDE的前世今生】

Share-VDE始于2016年。

2017年,意大利@CULT公司在BIBFRAME 2.0实施注册(BIBFRAME 2.0 Implementation Register)中添加了其开发的7所大学的目录门户:SHARE — Scholarly Heritage and Access to Research,包含200万书目记录、34万规范记录,采用BIBFRAME词表的关联数据发布。以FRBR化目录界面,呈现作者的增强信息。参见:BFRAME 2.0实施注册新增项目(附:意大利SHARE目录)(2017-7-25)

2018年BIBFRAME更新论坛,Casalini Libri(书目和规范数据提供者,PCC成员)、@Cult(ILS、发现工具、语义网解决方案厂商)介绍其与16个北美研究图书馆合作的Share-VDE项目(https://share-vde.org),用URI强化MARC记录。目录界面与SHARE相同,只是收录内容不同吧。参见:2018年BIBFRAME更新论坛(2018-11-14)

2019年初BIBFRAME更新论坛,斯坦福大学介绍LD4P2项目使用SHARE-VDE转换记录为BIBFRAME。参见:ALA 2019仲冬会议的BIBFRAME更新论坛(2019-2-17)

2020年LD4P3项目,Share-VDE作为托管编目环境,成为项目重要的协作者。LD4系列项目至此“闭环”,意在关联数据环境下创建一个完整周期的工作模型,进行图书馆元数据的创建、共享和重用。参见:关联数据编目走向现实——新项目LD4P3及LD4社区(2020-12-10)

2021年9月第5届欧洲BIBFRAME研讨会,公司介绍技术上重构的Share-VDE 2.0(https://svde.org/)。参见:2021欧洲BIBFRAME研讨会信息 (2021-10-17)

【Share-VDE声明】

与此同时,Share-VDE咨询委员发布了一个声明,描述该计划在图书馆关联开放数据的更广泛背景下的作用,内容包括SVDE概述、数据模型、LOD、PCC数据池、工具和发现(以下为谷歌翻译,仅少量人工干预,如链接数据->关联数据)

Share-VDE在图书馆关联开放数据中的作用(Share-VDE’s Role in Library Linked Open Data

概述

Share-VDE(虚拟发现环境)项目自 2016 年最初的 Share-VDE 原型以来一直是图书馆关联开放数据和 BIBFRAME 使用的领导者。 通过汇集来自欧洲和北美许多图书馆的数据,Share-VDE在异构环境中展示了 BIBFRAME 的强大功能。 Share-VDE 植根于美国国会图书馆开发的 BIBFRAME 数据模型,但扩展到来自许多图书馆的图书馆数据,显示了合作的力量。成员图书馆与 Casalini 和 @Cult 的开发团队合作,贡献了他们的数据、时间和资源来开发 Share-VDE。

数据模型

作为图书馆生态系统中的 BIBFRAME 节点,Share-VDE 提供丰富的数据,可与其他 BIBFRAME 节点互操作。 Share-VDE 将来自成员图书馆的 MARC 规范和书目数据汇集在一起,用权威实体对其进行丰富,并将数据聚类到 BIBFRAME 实体中。 Share-VDE 工作组详细审查了聚类,并扩展了 BIBFRAME 模型以满足现实世界的需求并反映参与图书馆的数据。数据模型的这种发展产生了 Share-VDE Opus(一种 bf:Work),它将所有相关内容表达组合或聚集在一起并代表原始/创造性作品,从而促进与 IFLA LRM 的互操作性。

关联的开放数据

Share-VDE 基础设施基于 LOD 平台,该平台旨在能够自动化创建和发布关联开放数据的过程,而不管数据源格式如何。 Sapientia 集群知识库在 RDF(因此作为关联开放数据)中可用,并可通过 SPARQL 端点和 API 查询访问。

PCC数据池

基于这项开发工作,Share-VDE 被 LD4P3 基金选中来创建 PCC 数据池。 Share-VDE 与 LD4P、OCLC 和 PCC 合作,将所有 BIBCO 和 Conser MARC 编目整合在一起。 Share-VDE 数据模型和聚类算法被应用于创建 PCC 质量 BIBFRAME 数据的开放池。 PCC 数据池将作为编目员使用 Sinopia 创建本地生产的 BIBFRAME 的可信数据源,以及任何用户都可以使用的关联开放数据。

工具

除了其他开发工作之外,Share-VDE 团队还在创建工具来处理数据。 Share-VDE 数据模型预计,在大量自动化实体集群中,某些集群或关系链接将不准确。 J.Cricket 编辑器提供了一种将直接用户专业知识应用于维护 Sapientia 集群知识库的方法。成员图书馆与开发团队也一直在探索和推荐外部数据源,以将其合并到为集群知识库提供数据的规范数据流中。此外,他们正在研究新的规范工具和服务,以与 BIBFRAME 模型保持一致并扩大规范数据的使用。

发现

最后,Share-VDE 带来了许多其他 BIBFRAME 项目所缺少的关键元素——发现。正如 Share-VDE 名称所示,Discovery 从一开始就是该项目的重点。 Share-VDE 发现基于 BIBFRAME,使用实体模型。与基于记录的目录不同,Share-VDE 侧重于作品和作者元素。这种新模型通过专注于原始作品而不是单个图书馆中的特定实例,避免了基于 MARC 的目录中存在明显重复记录的长期问题。这种方法超越了关联数据的丰富(例如数据卡),成为了一种新的发现方法。这是对 BIBFRAME 生态系统的一个巨大补充,展示了关联数据改善用户体验的力量。

总结

Share-VDE 是一个 BIBFRAME 节点,在新兴的书目生态系统中提供可与图书馆和其他 BIBFRAME 节点交换的权威数据。数据模型和工具是由一个强大的合作社区开发的。 Share-VDE 计划是该生态系统的领导者,并支持最终目标:促进丰富和结构化数据的重用,并为研究社区提供新一代获取知识的工具。