OCLC新数据模型:WorldCat本体

WorldCat本体是OCLC为WorldCat实体(WorldCat Entities)也即对应图书馆传统的规范数据所开发的本体。

在2023年欧洲BIBFRAME研讨会上,OCLC的Jeff Mixter有一个报告,介绍OCLC在关联数据方面所做工作,包括开发中的Meridian(子午线),也提到WorldCat本体(Meeting users where they are today: easing the burden of migrating to linked data)。但当时查不到该本体的详细信息。

2024年初发布的OCLC关联数据网页oc.lc/linkeddata(有中文版,链接数据:下一代图书馆元数据),“构建、维护和发展链接数据基础设施”部分如此介绍WorldCat本体:新数据模型

“WorldCat 本体是一个数据模型,提供描述图书馆链接数据所需的关键规范信息。它旨在满足图书馆的工作流程需求,在资源之间建立更多更好的连接,并支持图书馆的网络可见性和合作伙伴关系。”

参见:

最近找到了WorldCat本体的官网,有英法两种语言版本,最新版为3.1(比3.0版增加法语翻译):

WorldCat本体(WorldCat Ontology, wco:)

WorldCat实体包括作品、个人、地点、事件等。以下为WorldCat本体的类清单【( )标记为其子类】,各类定义有丰富的属性(略)。

[0] WorldCat Thing(OWL个体的类。以下6子类及其子类[以-表示],多沿用Thing定义的属性)

[1] WorldCat Agent(行为者。能够执行操作的实体)

  • – WorldCat Person
  • – WorldCat Family
  • – WorldCat Organization
  • — WorldCat Administrative Area (Organization) (团体子类,行政区域(组织)= Administrative Area (Place))
  • 原注:行政区域(地点)和行政区域(组织)是同一类。添加括号只是为了在层次结构中的两个位置显示它。

[2] WorldCat Concept(概念)【非主题】

  • – WorldCat Frequency
  • – WorldCat Measurement
  • – WorldCat Performance Medium
  • – WorldCat Postal Address
  • – WorldCat Role
  • – WorldCat Unit of Measure

[3] WorldCat Edition(版本)

[4] WorldCat Event(事件)

  • – WorldCat Transactional Event (事务性事件。特定类型的事件,旨在表示间接链接两个或多个受影响实体的事务性或转换性事件序列)

[5] WorldCat Place(地点)

  • – WorldCat Administrative Area (Place) (行政区域(地点),同时是团体子类 = Administrative Area (Organization))
  • – WorldCat Landform(地形地貌)

[6] WorldCat Work(作品)

  • – WorldCat Cartographic Material(地图资料)
  • – WorldCat Collection(文集)【组织形式】
  • — WorldCat Archival Collection (Collection)(档案集)
  • — WorldCat Continuing Resource (Collection)(连续性资源)
  • — WorldCat Integrating Resource (Continuing Resource)(集成资源)
  • — WorldCat Serial (Continuing Resource)(连续出版物)
  • — WorldCat Festschrift (Collection)(纪念文集)
  • — WorldCat Series (Collection)(丛编)
  • – WorldCat Data Set(数据集)
  • – WorldCat Interactive Resource(交互资源)【计算机程序/软件的细化。游戏?】
  • – WorldCat Software
  • – WorldCat Fictional Entity(虚构实体)【体裁?】
  • – WorldCat Image(图像)
  • — WorldCat Moving Image (Image)(动态图像)
  • — WorldCat Still Image (Image)(静态图像)
  • – WorldCat Notated Movement
  • – WorldCat Notated Music
  • – WorldCat Sound(声音)【未细分口语】
  • — WorldCat Music (Sound)(音乐)
  • – WorldCat Physical Object
  • – WorldCat Text
  • – WorldCat Website(网站)【集成资源特例】

【作品类比较】WorldCat作品有20多子类,接近BIBFRAME的作品子类,含RDA内容类型和组织形式2个方面:

主要差异(不免想起标准牙刷说……

  • 1、声音/音频:RDA有3类(声音、表演音乐、口语),WCO有2类(声音、音乐),BF只有1类(音频)。
  • 2、WCO增加的类:虚构实体(当指虚构类作品,非指LRM所说的虚构人物)。
  • 3、WCO细化的类:网站(RDA属集成资源),交互资源(软件的细化,如游戏?)。
  • 4、WCO的文集:对应于组织形式,其子类更多(如档案、纪念文集等)。

参见:BIBFRAME作品与实例的子类(及与RDA/MARC21的对照)(2024-6-14)

OCLC推出Meridian(WorldCat实体集成服务工具)

OCLC推出了WorldCat实体集成服务工具Meridian(子午线),这是图书馆传统编目规范库服务的关联数据升级版(这样描述只是为便于理解,肯定大大低估了其作用意义,详后附)。

这个工具应该是2020-2021年梅隆基金项目的成果,可参见:OCLC获梅隆基金资助开发实体管理基础设施(2020-1-11)/posts/2020/0111/5274。以Meridian介绍与项目宣布时信息对比,完成了实体标识符(URI)、关联现有规范档和外部词表、聚合实体的元数据描述,访问方式编辑和(6个)API;设想的实体类型有扩大,除人物和作品外,增加了地点和事件;使用模式设想有免费+订购,免费的访问选项在目前的介绍中没有提及;致谢除LD4之外,还包括Bibframe、PCC、RDA等20多个相关组织。

— 相关信息 —

上篇博文介绍“OCLC报告:关联数据,图书馆编目的未来”(/posts/2024/0626/6261):Linked data: The future of library cataloging。报告比较实质性的内容是提到OCLC今年1月推出的产品Meridian。年初的新闻稿(OCLC linked data services transform metadata management and connect library resources to wider knowledge streams. 2024-1-30.  https://www.oclc.org/en/news/releases/2024/20240130-linked-data.html)介绍OCLC将WorldCat实体标识符添加到WorldCat记录中,并将关联数据[链接数据]功能集成到图书馆已使用的编目服务,但并未提及产品名称,只给了一个更新后的OCLC关联数据网页的链接,有中文版:oc.lc/linkeddata(链接数据:下一代图书馆元数据),其中一节:介绍 OCLC Meridian®

“Meridian 是一款 WorldCat Entities™ 链接数据管理工具和 API 套件,支持创建和管理链接数据实体和描述性关系。通过与 MARC 记录中的现有值和全球信息生态系统中的其他数据集建立连接,丰富您的元数据。”

点击其后的“了解更多”,是产品主页,有各种详尽信息。中文版:Meridian——创建、管理和连接链接数据实体,提高元数据的可见性 https://www.oclc.org/zh-Hans/meridian.html(摘录附后)。

上个月(2024年5月)似乎产品正式上线可用了,又有一篇新闻,中文版:OCLC Meridian 使图书馆能够创建链接数据,将资源与更广泛的网络连接起来. 2024-5-9. https://www.oclc.org/zh-Hans/news/releases/2024/20240507-introducing-oclc-meridian.html 

本报道有较详细介绍,还有比产品主页更多的信息,如:

  • Meridian 提供了一套 API,使用户能够大规模创建和管理链接数据;查找不同图书馆来源的标识符(如 VIAF、ISNI、ORCID、ROR 等)以及通用知识图谱中的标识符(如 Wikidata 或 MusicBrainz)。
  • Meridian 的发布是 OCLC 长期链接数据战略的一个重要里程碑。

— Meridian 产品主页摘录 —

OCLC Meridian® 是一款直观的网络应用程序和一组 API,允许图书馆创建、管理和连接链接数据实体。通过与 MARC 记录中的现有值和全球信息生态系统中的其他数据集建立连接,丰富您的元数据。

  • 提高图书馆的可检索性和与用户的相关性……
  • 将链接数据管理集成到现有工作流程——有了 Meridian,您无需一次性“全面投入”。您可以根据自己的图书馆或组织的实际情况促进这一过程,无需干扰现有的工作流程。使用网络应用程序逐个创建、管理和连接 WorldCat 实体数据,或使用 API 套件轻松转换和大规模利用现有元数据。
  • 发现、强调和分析重要关系……
  • 为建立可扩展、可持续的链接数据网络做贡献……
  • 利用 API 轻松转换和大规模利用现有元数据——开发人员可以利用可提供不同级别编程访问的 WorldCat 实体 API 套件。

实体管理 API:创建和管理 WorldCat 实体链接数据

实体搜索 API:搜索与现有描述性元数据相匹配的标识符

实体变更 API:了解 WorldCat 实体数据的变更

PID 查找 API:连接多个词汇表中的永久标识符 (PID)

实体连接 API:检索相关数据子集,供本地检索应用程序使用

实体查询 API:查询整个 WorldCat 实体数据集

  • (最后)为什么选择 Meridian?Meridian 是图书馆实现链接数据的重要一步。

-将 MARC 编目和其他数据集与现有工作流程集成

连接不同词汇表和规范(如 ORCID 和 VIAF)的标识符

-可作为独立服务或 OCLC 编目订阅的附加服务在全球范围内提供

-与 OCLC 社区中心不断壮大的元数据专业人员合作

OCLC报告:关联数据,图书馆编目的未来

OCLC近日发布报告:关联数据,图书馆编目的未来

来自OCLC新闻:”Linked data: The future of library cataloging” is available now on the website.2024-6-24. https://www.oclc.org/en/news/releases/2024/20240624-linked-data-position-paper.html

先让Kimi读一下pdf文件,整理核心内容如下:

  • 这份文件是关于图书馆目录编目未来的报告,主要讨论了链接数据[关联数据](Linked Data)的概念及其在图书馆领域的应用前景。以下是报告的核心内容概述:
  • 1. 链接数据的重要性:/ 随着在线信息量的增加,良好的元数据变得尤为重要。/ 链接数据是一种组织和连接网络数据的方式,便于不同系统和自动化服务的共享和使用。
  • 2. 链接数据的定义和作用:/ 链接数据通过使用统一资源标识符(URIs)打破传统的MARC记录,使图书馆数据更易于访问和连接。
  • 3. 图书馆元数据的局限性:/ 传统元数据适合已知项目的搜索,但发现潜在有价值的联系需要时间和专业知识。
  • 4. 链接数据的优势:/ 链接数据可以帮助用户发现意外的新路径和资源。/ 它提高了图书馆资源的可见性,并改善了搜索结果。
  • 5. 图书馆工作的转折点:/ 目前,图书馆的元数据主要在MARC记录和其他固定格式数据资源中创建和管理,这限制了它们在其他环境中的使用。
  • 6. 链接数据对图书馆的好处:/ 链接数据连接并扩展了图书馆知识,促进了偶然发现,并使图书馆专家能够专注于高价值的知识工作。/ 它还使图书馆能够积极贡献于全球信息生态系统。
  • 7. OCLC对链接数据的承诺:/ OCLC致力于提供基础设施、工具和专业知识,以支持图书馆在元数据演变中的过渡。
  • 8. 链接数据的实现:/ OCLC正在开发链接数据产品、服务和数据集,以连接数据并提供大规模数据管理所需的资源。
  • 9. OCLC的长期战略:/ 包括专业知识、数据、基础设施和工具,旨在帮助各种规模和类型的图书馆顺利过渡到链接数据模型。
  • 10. 链接数据的未来:/ 链接数据为图书馆提供了连接独特工作与更多用户、合作伙伴和社区的重大机会。
  • 报告最后邀请读者学习、实验、实践、成长和与OCLC一起创新链接数据,并感谢所有参与链接数据研究和技术项目的人员和合作伙伴。
  • 这份报告强调了链接数据在图书馆领域的潜力,以及OCLC在推动这一变革中的作用。

关联数据谈这么久,说它是编目的未来,并不是什么新观点。OCLC多年来一直关注关联数据,为什么突然发布一份看似平平无奇的报告?报告中说,“虽然OCLC对关联数据的研究可以追溯到十多年前,但我们刚刚开始将其集成到图书馆管理任务中”,显然是为推新产品/服务造势。目前来说,就是报告中提及的Meridian(子午线),WorldCat实体的集成服务工具(将另写博文)。

而Meridian应该只是开始,本报告“工具”部分说:“我们今天正在将链接数据集成到图书馆工作流中,同时也在为明天做计划。我们正在创建一套复杂的新工具,向现有记录和工作流添加有价值的链接数据元素,同时在可预见的将来维护并行MARC服务和应用程序。”

是不是可以这么理解——在可以预见的很长一段时间,还会有很多图书馆继续使用MARC,他们也需要让自己的目录进入关联数据世界。不用说,BIBFRAME也可以使用WorldCat实体标识符。

— WorldCat实体及关联数据标识符 —

从报告看,OCLC的关联数据战略,目前主要围绕WorldCat书目记录中的实体URI,WorldCat实体包括作品、个人、地点、事件等。上述几个网页中提供的数据是,WorldCat实体有1.5亿,已有4亿WorldCat实体URI(标识符)添加到WorldCat的MARC记录中。

年初的2024冬BIBFRAME更新论坛,OCLC有报告:OCLC为BIBFRAME所做的准备(OCLC’s preparation forBIBFRAME / Jeff Mixter. 9 slides),其中讲到OCLC在关联数据标识符及相关工具方面的进展:

  • 2023年12月,已将个人、地点和事件的WorldCat实体URI添加到WorldCat记录中
  • 2024年1月,开始将作品的WorldCat实体URI添加到WorldCat记录中
  • [工具]2024年1月底,WorldShare Record Manager集成WorldCat实体查找和URI插入编目工作流程。/ 发布此工具的目的在于,弥合传统记录和关联数据框架之间的差距,实现数据的无缝创建和管理。此工具将为MARC编目员提供在编目时添加关联数据特征的能力,以帮助改进数据转换到关联数据,并支持已经在BIBFRAME 2.0中编目的图书馆员。

参见:2024冬BIBFRAME更新论坛(2024-2-8) /posts/2024/0208/6201