关联数据 – 第 2 页 – 编目精灵III

OCLC报告：关联数据，图书馆编目的未来

OCLC近日发布报告：关联数据，图书馆编目的未来

来自OCLC新闻：”Linked data: The future of library cataloging” is available now on the website.2024-6-24. https://www.oclc.org/en/news/releases/2024/20240624-linked-data-position-paper.html

先让Kimi读一下pdf文件，整理核心内容如下：

这份文件是关于图书馆目录编目未来的报告，主要讨论了链接数据[关联数据]（Linked Data）的概念及其在图书馆领域的应用前景。以下是报告的核心内容概述：
1. 链接数据的重要性：/ 随着在线信息量的增加，良好的元数据变得尤为重要。/ 链接数据是一种组织和连接网络数据的方式，便于不同系统和自动化服务的共享和使用。
2. 链接数据的定义和作用：/ 链接数据通过使用统一资源标识符（URIs）打破传统的MARC记录，使图书馆数据更易于访问和连接。
3. 图书馆元数据的局限性：/ 传统元数据适合已知项目的搜索，但发现潜在有价值的联系需要时间和专业知识。
4. 链接数据的优势：/ 链接数据可以帮助用户发现意外的新路径和资源。/ 它提高了图书馆资源的可见性，并改善了搜索结果。
5. 图书馆工作的转折点：/ 目前，图书馆的元数据主要在MARC记录和其他固定格式数据资源中创建和管理，这限制了它们在其他环境中的使用。
6. 链接数据对图书馆的好处：/ 链接数据连接并扩展了图书馆知识，促进了偶然发现，并使图书馆专家能够专注于高价值的知识工作。/ 它还使图书馆能够积极贡献于全球信息生态系统。
7. OCLC对链接数据的承诺：/ OCLC致力于提供基础设施、工具和专业知识，以支持图书馆在元数据演变中的过渡。
8. 链接数据的实现：/ OCLC正在开发链接数据产品、服务和数据集，以连接数据并提供大规模数据管理所需的资源。
9. OCLC的长期战略：/ 包括专业知识、数据、基础设施和工具，旨在帮助各种规模和类型的图书馆顺利过渡到链接数据模型。
10. 链接数据的未来：/ 链接数据为图书馆提供了连接独特工作与更多用户、合作伙伴和社区的重大机会。
报告最后邀请读者学习、实验、实践、成长和与OCLC一起创新链接数据，并感谢所有参与链接数据研究和技术项目的人员和合作伙伴。
这份报告强调了链接数据在图书馆领域的潜力，以及OCLC在推动这一变革中的作用。

关联数据谈这么久，说它是编目的未来，并不是什么新观点。OCLC多年来一直关注关联数据，为什么突然发布一份看似平平无奇的报告？报告中说，“虽然OCLC对关联数据的研究可以追溯到十多年前，但我们刚刚开始将其集成到图书馆管理任务中”，显然是为推新产品/服务造势。目前来说，就是报告中提及的Meridian（子午线），WorldCat实体的集成服务工具（将另写博文）。

而Meridian应该只是开始，本报告“工具”部分说：“我们今天正在将链接数据集成到图书馆工作流中，同时也在为明天做计划。我们正在创建一套复杂的新工具，向现有记录和工作流添加有价值的链接数据元素，同时在可预见的将来维护并行MARC服务和应用程序。”

是不是可以这么理解——在可以预见的很长一段时间，还会有很多图书馆继续使用MARC，他们也需要让自己的目录进入关联数据世界。不用说，BIBFRAME也可以使用WorldCat实体标识符。

— WorldCat实体及关联数据标识符 —

从报告看，OCLC的关联数据战略，目前主要围绕WorldCat书目记录中的实体URI，WorldCat实体包括作品、个人、地点、事件等。上述几个网页中提供的数据是，WorldCat实体有1.5亿，已有4亿WorldCat实体URI（标识符）添加到WorldCat的MARC记录中。

年初的2024冬BIBFRAME更新论坛，OCLC有报告：OCLC为BIBFRAME所做的准备（OCLC’s preparation forBIBFRAME / Jeff Mixter. 9 slides），其中讲到OCLC在关联数据标识符及相关工具方面的进展：

2023年12月，已将个人、地点和事件的WorldCat实体URI添加到WorldCat记录中
2024年1月，开始将作品的WorldCat实体URI添加到WorldCat记录中
[工具]2024年1月底，WorldShare Record Manager集成WorldCat实体查找和URI插入编目工作流程。/ 发布此工具的目的在于，弥合传统记录和关联数据框架之间的差距，实现数据的无缝创建和管理。此工具将为MARC编目员提供在编目时添加关联数据特征的能力，以帮助改进数据转换到关联数据，并支持已经在BIBFRAME 2.0中编目的图书馆员。

参见：2024冬BIBFRAME更新论坛（2024-2-8） /posts/2024/0208/6201

《维护和记录IFLA词表指南》

《维护和记录IFLA词表指南》，由国际图联（IFLA）关联数据技术评审委员会（LIDATEC）制订，供IFLA各评审组维护和记录关于IFLA命名空间的标准。

指南旨在确保网站上包含的标准有明确的介绍信息，并有适当的链接到更多信息，包括谁负责该标准以及如何联系他们，以及有关版本、更新和发布的信息。

指南2023年8月获批，最终目的应当是促进使用IFLA命名空间的词表。

IFLA命名空间（IFLA Namespaces）：https://www.iflastandards.info/
IFLA标准的GitHub（iflastandards）：https://github.com/iflastandards

目前有5种词表：

The FRBR Vocabularies
The ISBD Vocabularies
The LRM Vocabularies
The UNIMARC Vocabularies
MulDiCat

参见：IFLA命名空间：IFLA标准作为关联数据（2021-5-31）

《维护和记录IFLA词表指南》Guidelines for Maintaining and Documenting IFLA Vocabularies / by LIDATEC; Approved by Advisory Committee on Standards. 9 October 2023. 9 pages.

【目次】（及少量摘录）

[1] 关于这些指南的信息

[2] 词表描述

词表的定义、范围和所有者
词表名称
词表URI
首选术语、类别和属性的近似数量（或实际数量，如果可得）
所涵盖主题领域的描述或包含的主题列表
词表“所有者”或负责的IFLA单位。如果负责单位随着时间的推移发生了变化，这可能包括历史信息，并链接回IFLA单位网站
状态（发展中、现役、退役等）
版本信息和维护策略
可用语言
可用的传递机制和文件格式

[3] 许可

CC BY 4.0：可以在未经许可的情况下自由复制、分发、传输、翻译、改编和商业使用，前提是任何使用都归因于IFLA。

[4] 获取

词表的RDF版本应可从IFLA词表服务器和GitHub获得，有以下几种版本：

JSON-LD(json)
Notations 3 (n3)
N-Triples (nt)
Turtle (ttl)
XML

[5] 维护

语义版本控制。编号的版本级别：0.x.x预发布，1.x.x主要，x.1.x次要，x.x.1编辑/补丁。

翻译。由相应的IFLA评审小组批准。

弃用

[6] 治理

扩展、映射、翻译

[7] 脚注（参考文献）

[8] 附件1（摘录NISO TR-06-2017词表管理问题）

Share Family发展概要及2023年总结

Share Family 由两家意大利公司 Casalini Libri（书商）和 @cult（软件公司）主导，始于2016年意大利多家大学图书馆的联合目录SHARE。参见：BIBFRAME 2.0实施注册新增项目（附：意大利SHARE目录）（2017-7-25）

SHARE原本是刻意选择的首字母缩略词 Scholarly Heritage and Access to Research，后来直接用作“共享”之意。2017年起公司与LD4P项目、若干北美大学图书馆共同开发Share-VDE，影响逐渐扩大。参见：Share-VDE在图书馆关联开放数据中的作用（2021-10-30）

2019年12月，不定期刊物 Share Family Bulletin 发刊，显示Share Family雏形初现。之后各期，可追踪这些年的进展。

2023年建立 Share Family网站：https://www.Share-Family.org

刊物最新为2023年12月第8期 Share Family Bulletin (2023.12 no.8)，总结2023年Share Family倡议的成就和挑战，实际也概述了整个发展史。

以下为第8期翻译摘编，含本人先前相关博文链接。文中的图似乎都是从之前各演讲PPT中取来，与文字不尽配套。

把原结语移到最前面，突显Share Family的背景与态度：

【结语】通过采用BIBFRAME作为与IFLA-LRM兼容的主要本体，Share Family利用关联开放数据的潜力，促进数据池之间的互操作性，与MARC共存。

图[1]：Share Family发展时间线（2016-2023）

2016 Share目录上线，开始Share-VDE原型；
2017-2019 Share-VDE成员和LD4P成员数据由MARC21到BIBFRAME；
2019-2021 Share-VDE 图书馆LOD环境；
2021 Share Family启动全LOD平台项目；PCC数据池开始；Share-VDE 2.0 新关联数据管理系统和实体发现门户；国家书目工作组开始；
2022 Share Family走向生产；
2023 英国国家书目（beta）走向生产；JCricket【参见：JCricket实体编辑器（2023-10-16）】

图[2]：Share Family 活跃租户和发现网站【图中没有LILLIT，有尚在开发中的3个项目Share ART艺术、Share MUSIC音乐、Share MIA手稿与古籍（LILLIT或归入此）】

Share-VDE（虚拟发现环境）https://www.svde.org/
SHARE目录-意大利大学图书馆网络 https://catalogo.share-cat.unina.it/sharecat/clusters?l=en
PCC数据池-关联开放数据中的合作编目（PCC）目录计划 https://pcc-lod.org/ （2024初数据将重新索引）
关联开放数据中的国家书目 https://www.natbib-lod.org/（2023英国国家书目beta上线 https://bl.natbib-lod.org ）
Parsifal-URBE联盟（罗马教会图书馆联盟）的LOD门户网站 https://parsifal.urbe.it/parsifal/?l=en
LILLIT-意大利插图书籍门户网站，提供16至18世纪印刷的意大利版本的关联开放数据描述和插图 https://lillit.share-family.org/lillit/?l=en

图[3]：Share Family 租户基础架构【以 SVDE Sapientia CKB 中央知识库为中心】

Share Family索引 -> SVDE Sapientia CKB/实体注册 -> Share-VDE发现端口和机构皮肤/各租户门户
Share Family索引 -> 各租户CKB -> 各租户网站
Share-VDE图书馆的原记录 -> SVDE Sapientia CKB

【工作组/列举部分】Share-VDE和Share Family工作组，由咨询委员会指导：

SEI–Sapientia实体识别工作组：致力于创建Share-VDE本体（BIBFRAME的扩展）https://doi.org/10.5281/zenodo.8332350【参见：Share-VDE本体：BIBFRAME扩展（2023-10-15） /posts/2023/1015/6147】
用户体验–用户界面工作组：测试和使用Share-VDE 2.0测试版和国家书目门户网站
国家书目工作组

【第三方整合】

Share Family技术的发展包括将LOD平台产生的数据与外部系统相互集成的能力，尤其是与本地ILS和图书馆服务平台以及权威来源的集成。

关于与ILS和LSP整合，值得一提的是一些进步：

-由SVDE AIMS工作组设计并由斯坦福大学图书馆进一步投入的基于MARC的工作流程的新规范服务已经完成，可供愿意测试和使用它们的机构使用。此外，AIMS工作组将于2024年重新召开会议，分析和设计基于RDF/关联数据的工作流的规范控制功能；

-Alma流通API与地方图书馆服务的整合工作基本完成；

-与原生BIBFRAME编目编辑器Sinopia的集成正在进行中：来自Sinopia将由Share-VDE过程聚类的传入RDF数据的解析器正在开发中；

-已经分析了与FOLIO ILS的连接，以将FOLIO典藏数据与Share-VDE数据相关联，并将JCrick用户界面集成到FOLIO中。Share Family团队的Andrea Gazzarini和WOLFcon 2023的Index Data的Sebastian Hammer提出了一个通过FOLIO进行ILS/LSP交互的可能模型，以在相关数据社区内讨论如何寻求这种联系。

关于与规范系统整合，正在调查几个数据来源，在某些情况下，已经完成了初步整合步骤：

-LD4P提问规范（Questioning Authority）查询工具；

-用于相互丰富实体ID的Wikidata（最初的规范由SVDE工作组制定）；

-用于相互丰富实体ID的ISNI（初始规范由SVDE工作组制定）。

【UNIMARC-BIBFRAME转换】

SHARE目录倡议已经完成了UNIMARC-BIBFRAME直接映射和转换的工作（没有通过MARC的中间步骤），并将通过将得到丰富和记录的Wikibase实例与关联数据社区共享这项工作https://unimarc2bibframe.wikibase.cloud/。【2024/1/5内容为空】

【非拉丁文字丰富LOD平台】

2024年国立台湾大学图书馆将加入Share Family，由国立台湾大学图书馆提供的数据将由LD4P非拉丁文字资料亲和小组进行测试；
正在使用一个支持阿拉伯文字的测试门户进行实验