OCLC报告:关联数据,图书馆编目的未来

OCLC近日发布报告:关联数据,图书馆编目的未来

来自OCLC新闻:”Linked data: The future of library cataloging” is available now on the website.2024-6-24. https://www.oclc.org/en/news/releases/2024/20240624-linked-data-position-paper.html

先让Kimi读一下pdf文件,整理核心内容如下:

  • 这份文件是关于图书馆目录编目未来的报告,主要讨论了链接数据[关联数据](Linked Data)的概念及其在图书馆领域的应用前景。以下是报告的核心内容概述:
  • 1. 链接数据的重要性:/ 随着在线信息量的增加,良好的元数据变得尤为重要。/ 链接数据是一种组织和连接网络数据的方式,便于不同系统和自动化服务的共享和使用。
  • 2. 链接数据的定义和作用:/ 链接数据通过使用统一资源标识符(URIs)打破传统的MARC记录,使图书馆数据更易于访问和连接。
  • 3. 图书馆元数据的局限性:/ 传统元数据适合已知项目的搜索,但发现潜在有价值的联系需要时间和专业知识。
  • 4. 链接数据的优势:/ 链接数据可以帮助用户发现意外的新路径和资源。/ 它提高了图书馆资源的可见性,并改善了搜索结果。
  • 5. 图书馆工作的转折点:/ 目前,图书馆的元数据主要在MARC记录和其他固定格式数据资源中创建和管理,这限制了它们在其他环境中的使用。
  • 6. 链接数据对图书馆的好处:/ 链接数据连接并扩展了图书馆知识,促进了偶然发现,并使图书馆专家能够专注于高价值的知识工作。/ 它还使图书馆能够积极贡献于全球信息生态系统。
  • 7. OCLC对链接数据的承诺:/ OCLC致力于提供基础设施、工具和专业知识,以支持图书馆在元数据演变中的过渡。
  • 8. 链接数据的实现:/ OCLC正在开发链接数据产品、服务和数据集,以连接数据并提供大规模数据管理所需的资源。
  • 9. OCLC的长期战略:/ 包括专业知识、数据、基础设施和工具,旨在帮助各种规模和类型的图书馆顺利过渡到链接数据模型。
  • 10. 链接数据的未来:/ 链接数据为图书馆提供了连接独特工作与更多用户、合作伙伴和社区的重大机会。
  • 报告最后邀请读者学习、实验、实践、成长和与OCLC一起创新链接数据,并感谢所有参与链接数据研究和技术项目的人员和合作伙伴。
  • 这份报告强调了链接数据在图书馆领域的潜力,以及OCLC在推动这一变革中的作用。

关联数据谈这么久,说它是编目的未来,并不是什么新观点。OCLC多年来一直关注关联数据,为什么突然发布一份看似平平无奇的报告?报告中说,“虽然OCLC对关联数据的研究可以追溯到十多年前,但我们刚刚开始将其集成到图书馆管理任务中”,显然是为推新产品/服务造势。目前来说,就是报告中提及的Meridian(子午线),WorldCat实体的集成服务工具(将另写博文)。

而Meridian应该只是开始,本报告“工具”部分说:“我们今天正在将链接数据集成到图书馆工作流中,同时也在为明天做计划。我们正在创建一套复杂的新工具,向现有记录和工作流添加有价值的链接数据元素,同时在可预见的将来维护并行MARC服务和应用程序。”

是不是可以这么理解——在可以预见的很长一段时间,还会有很多图书馆继续使用MARC,他们也需要让自己的目录进入关联数据世界。不用说,BIBFRAME也可以使用WorldCat实体标识符。

— WorldCat实体及关联数据标识符 —

从报告看,OCLC的关联数据战略,目前主要围绕WorldCat书目记录中的实体URI,WorldCat实体包括作品、个人、地点、事件等。上述几个网页中提供的数据是,WorldCat实体有1.5亿,已有4亿WorldCat实体URI(标识符)添加到WorldCat的MARC记录中。

年初的2024冬BIBFRAME更新论坛,OCLC有报告:OCLC为BIBFRAME所做的准备(OCLC’s preparation forBIBFRAME / Jeff Mixter. 9 slides),其中讲到OCLC在关联数据标识符及相关工具方面的进展:

  • 2023年12月,已将个人、地点和事件的WorldCat实体URI添加到WorldCat记录中
  • 2024年1月,开始将作品的WorldCat实体URI添加到WorldCat记录中
  • [工具]2024年1月底,WorldShare Record Manager集成WorldCat实体查找和URI插入编目工作流程。/ 发布此工具的目的在于,弥合传统记录和关联数据框架之间的差距,实现数据的无缝创建和管理。此工具将为MARC编目员提供在编目时添加关联数据特征的能力,以帮助改进数据转换到关联数据,并支持已经在BIBFRAME 2.0中编目的图书馆员。

参见:2024冬BIBFRAME更新论坛(2024-2-8) /posts/2024/0208/6201


《维护和记录IFLA词表指南》

《维护和记录IFLA词表指南》,由国际图联(IFLA)关联数据技术评审委员会(LIDATEC)制订,供IFLA各评审组维护和记录关于IFLA命名空间的标准。

指南旨在确保网站上包含的标准有明确的介绍信息,并有适当的链接到更多信息,包括谁负责该标准以及如何联系他们,以及有关版本、更新和发布的信息。

指南2023年8月获批,最终目的应当是促进使用IFLA命名空间的词表。

目前有5种词表:

  • The FRBR Vocabularies
  • The ISBD Vocabularies
  • The LRM Vocabularies
  • The UNIMARC Vocabularies
  • MulDiCat

参见:IFLA命名空间:IFLA标准作为关联数据(2021-5-31)

《维护和记录IFLA词表指南》Guidelines for Maintaining and Documenting IFLA Vocabularies / by LIDATEC;  Approved by Advisory Committee on Standards. 9 October 2023. 9 pages.

目次】(及少量摘录)

[1] 关于这些指南的信息

[2] 词表描述

  • 词表的定义、范围和所有者
  • 词表名称
  • 词表URI
  • 首选术语、类别和属性的近似数量(或实际数量,如果可得)
  • 所涵盖主题领域的描述或包含的主题列表
  • 词表“所有者”或负责的IFLA单位。如果负责单位随着时间的推移发生了变化,这可能包括历史信息,并链接回IFLA单位网站
  • 状态(发展中、现役、退役等)
  • 版本信息和维护策略
  • 可用语言
  • 可用的传递机制和文件格式

[3] 许可

CC BY 4.0:可以在未经许可的情况下自由复制、分发、传输、翻译、改编和商业使用,前提是任何使用都归因于IFLA。

[4] 获取

词表的RDF版本应可从IFLA词表服务器和GitHub获得,有以下几种版本:

  • JSON-LD(json)
  • Notations 3 (n3)
  • N-Triples (nt)
  • Turtle (ttl)
  • XML

[5] 维护

语义版本控制。编号的版本级别:0.x.x预发布,1.x.x主要,x.1.x次要,x.x.1编辑/补丁。

翻译。由相应的IFLA评审小组批准。

弃用

[6] 治理

扩展、映射、翻译

[7] 脚注(参考文献)

[8] 附件1(摘录NISO TR-06-2017词表管理问题

Share Family发展概要及2023年总结

Share Family 由两家意大利公司 Casalini Libri(书商)和 @cult(软件公司)主导,始于2016年意大利多家大学图书馆的联合目录SHARE。参见BIBFRAME 2.0实施注册新增项目(附:意大利SHARE目录)(2017-7-25)

SHARE原本是刻意选择的首字母缩略词 Scholarly Heritage and Access to Research,后来直接用作“共享”之意。2017年起公司与LD4P项目、若干北美大学图书馆共同开发Share-VDE,影响逐渐扩大。参见Share-VDE在图书馆关联开放数据中的作用(2021-10-30)

2019年12月,不定期刊物 Share Family Bulletin 发刊,显示Share Family雏形初现。之后各期,可追踪这些年的进展。

2023年建立 Share Family网站:https://www.Share-Family.org

刊物最新为2023年12月第8期 Share Family Bulletin (2023.12 no.8),总结2023年Share Family倡议的成就和挑战,实际也概述了整个发展史。

以下为第8期翻译摘编,含本人先前相关博文链接。文中的图似乎都是从之前各演讲PPT中取来,与文字不尽配套。

把原结语移到最前面,突显Share Family的背景与态度:

【结语】通过采用BIBFRAME作为与IFLA-LRM兼容的主要本体,Share Family利用关联开放数据的潜力,促进数据池之间的互操作性,与MARC共存。

Share Family发展时间线(2016-2023)

图[1]:Share Family发展时间线(2016-2023)

  • 2016 Share目录上线,开始Share-VDE原型;
  • 2017-2019 Share-VDE成员和LD4P成员数据由MARC21到BIBFRAME;
  • 2019-2021 Share-VDE 图书馆LOD环境;
  • 2021 Share Family启动全LOD平台项目;PCC数据池开始;Share-VDE 2.0 新关联数据管理系统和实体发现门户;国家书目工作组开始;
  • 2022 Share Family走向生产;
  • 2023 英国国家书目(beta)走向生产;JCricket【参见JCricket实体编辑器(2023-10-16)】
Share Family 活跃租户和发现网站

图[2]:Share Family 活跃租户和发现网站【图中没有LILLIT,有尚在开发中的3个项目Share ART艺术、Share MUSIC音乐、Share MIA手稿与古籍(LILLIT或归入此)】

Share Family 租户基础架构

图[3]:Share Family 租户基础架构【以 SVDE Sapientia CKB 中央知识库 为中心】

  • Share Family索引 -> SVDE Sapientia CKB/实体注册 -> Share-VDE发现端口和机构皮肤/各租户门户
  • Share Family索引 -> 各租户CKB -> 各租户网站
  • Share-VDE图书馆的原记录 -> SVDE Sapientia CKB

工作组/列举部分】Share-VDE和Share Family工作组,由咨询委员会指导:

  • SEI–Sapientia实体识别工作组:致力于创建Share-VDE本体(BIBFRAME的扩展)https://doi.org/10.5281/zenodo.8332350【参见:Share-VDE本体:BIBFRAME扩展(2023-10-15) /posts/2023/1015/6147】
  • 用户体验–用户界面工作组:测试和使用Share-VDE 2.0测试版和国家书目门户网站
  • 国家书目工作组
【第三方整合】
Share Family技术的发展包括将LOD平台产生的数据与外部系统相互集成的能力,尤其是与本地ILS和图书馆服务平台以及权威来源的集成。
  • 关于与ILS和LSP整合,值得一提的是一些进步:

-由SVDE AIMS工作组设计并由斯坦福大学图书馆进一步投入的基于MARC的工作流程的新规范服务已经完成,可供愿意测试和使用它们的机构使用。此外,AIMS工作组将于2024年重新召开会议,分析和设计基于RDF/关联数据的工作流的规范控制功能;

-Alma流通API与地方图书馆服务的整合工作基本完成;

-与原生BIBFRAME编目编辑器Sinopia的集成正在进行中:来自Sinopia将由Share-VDE过程聚类的传入RDF数据的解析器正在开发中;

-已经分析了与FOLIO ILS的连接,以将FOLIO典藏数据与Share-VDE数据相关联,并将JCrick用户界面集成到FOLIO中。Share Family团队的Andrea Gazzarini和WOLFcon 2023的Index Data的Sebastian Hammer提出了一个通过FOLIO进行ILS/LSP交互的可能模型,以在相关数据社区内讨论如何寻求这种联系。

  • 关于与规范系统整合,正在调查几个数据来源,在某些情况下,已经完成了初步整合步骤:

-LD4P提问规范(Questioning Authority)查询工具;

-用于相互丰富实体ID的Wikidata(最初的规范由SVDE工作组制定);

-用于相互丰富实体ID的ISNI(初始规范由SVDE工作组制定)。

UNIMARC-BIBFRAME转换

SHARE目录倡议已经完成了UNIMARC-BIBFRAME直接映射和转换的工作(没有通过MARC的中间步骤),并将通过将得到丰富和记录的Wikibase实例与关联数据社区共享这项工作https://unimarc2bibframe.wikibase.cloud/2024/1/5内容为空

非拉丁文字丰富LOD平台

  • 2024年国立台湾大学图书馆将加入Share Family,由国立台湾大学图书馆提供的数据将由LD4P非拉丁文字资料亲和小组进行测试;
  • 正在使用一个支持阿拉伯文字的测试门户进行实验