2024夏BIBFRAME更新论坛

今夏BIBFRAME更新论坛于2024-7-1举行,视频及PPT已上线。与1月论坛一样,这次也只有2个报告,其中一个还是美国国会图书馆(LC)自己的。

参见:2024冬BIBFRAME更新论坛(2024-2-8)

BIBFRAME July 2024 Update Forum. https://www.loc.gov/bibframe/news/bibframe-update-jul2024.html

  • 开场中Sally McCallum首先介绍了LC的最近活动

[1] 发布MARC到BIBFRAME和BIBFRAME到MARC转换的更新(2.6版)。包含改进的标题和管理元数据的$1URI转换。【规范检索点加$1……见:说明文件

[2] 在接下来的几个月里,一些LC编目员将开始在我们的BIBFRAME系统中编目,他们创建的记录将由系统转换为MARC,而不是在MARC中对记录进行双重键入【终于正式开始了】。这些记录的一些特征将通过从BIBFRAME转换进入我们的MARC 文件……。将在下周发布对它们的描述——但没有什么太大的惊喜:更多URI在$1、更多使用3XX字段等。我们随意地称其为“现代 MARC”(Modern MARC),因为我们更多地利用了自2008年以来建立的MARC字段,主要是为了适应RDA。

  • LC的报告:ScriptShifter:增强图书馆元数据和发现(ScriptShifter: Enhancing Library Metadata and Discovery / Paul Frank and Matt Miller)

ScriptShifter是LC新开发的、开源的罗马化音译工具——多种文字与拉丁字母间相互转换。【以往编目时,对非拉丁文字需要音译成拉丁字母……(将另写博文)】

在线使用:https://bibframe.org/scriptshifter

也可本地运行、本机运行、通过API集成到其他软件中使用:

[1]在GitHub上运行基于Python的开源工具,源代码:https://github.com/lcnetdev/scriptshifter/

[2]运行在Docker hub上找到的工具的打包Docker镜像:https://hub.docker.com/r/lcnetdev/scriptshifter/tags

[3]使用内置web应用程序或查阅API文档:https://github.com/lcnetdev/scriptshifter/blob/main/doc/rest_api.md

  • 外部机构的报告,来自Share Family(Share-VDE),Sally McCallum称是“第一个对BIBFRAME做出重大承诺的系统”:促进BIBFRAME协作:与Share Family的互操作性和数据管理(Fostering BIBFRAME collaboration: interoperability and data curation with the Share Family / Tizianna Possemato, Casalini Libri – @Cult)

报告以多种图示介绍Share Family背景:包含的项目,2016-2024发展时间线。

Share Family的数据处理和输出,特别是Sapientia集群知识库(CKB)和 JCricket实体编辑器;CKB中深度粒度化,包括数据分组。

最后是LC最关注的互操作——强调在Share-VDE本体中包含bf:Hub,保证互操作

Share Family(Share-VDE)近年在图书馆关联数据领域很活跃,部分相关博文可参见:

OCLC新数据模型:WorldCat本体

WorldCat本体是OCLC为WorldCat实体(WorldCat Entities)也即对应图书馆传统的规范数据所开发的本体。

在2023年欧洲BIBFRAME研讨会上,OCLC的Jeff Mixter有一个报告,介绍OCLC在关联数据方面所做工作,包括开发中的Meridian(子午线),也提到WorldCat本体(Meeting users where they are today: easing the burden of migrating to linked data)。但当时查不到该本体的详细信息。

2024年初发布的OCLC关联数据网页oc.lc/linkeddata(有中文版,链接数据:下一代图书馆元数据),“构建、维护和发展链接数据基础设施”部分如此介绍WorldCat本体:新数据模型

“WorldCat 本体是一个数据模型,提供描述图书馆链接数据所需的关键规范信息。它旨在满足图书馆的工作流程需求,在资源之间建立更多更好的连接,并支持图书馆的网络可见性和合作伙伴关系。”

参见:

最近找到了WorldCat本体的官网,有英法两种语言版本,最新版为3.1(比3.0版增加法语翻译):

WorldCat本体(WorldCat Ontology, wco:)

WorldCat实体包括作品、个人、地点、事件等。以下为WorldCat本体的类清单【( )标记为其子类】,各类定义有丰富的属性(略)。

[0] WorldCat Thing(OWL个体的类。以下6子类及其子类[以-表示],多沿用Thing定义的属性)

[1] WorldCat Agent(行为者。能够执行操作的实体)

  • – WorldCat Person
  • – WorldCat Family
  • – WorldCat Organization
  • — WorldCat Administrative Area (Organization) (团体子类,行政区域(组织)= Administrative Area (Place))
  • 原注:行政区域(地点)和行政区域(组织)是同一类。添加括号只是为了在层次结构中的两个位置显示它。

[2] WorldCat Concept(概念)【非主题】

  • – WorldCat Frequency
  • – WorldCat Measurement
  • – WorldCat Performance Medium
  • – WorldCat Postal Address
  • – WorldCat Role
  • – WorldCat Unit of Measure

[3] WorldCat Edition(版本)

[4] WorldCat Event(事件)

  • – WorldCat Transactional Event (事务性事件。特定类型的事件,旨在表示间接链接两个或多个受影响实体的事务性或转换性事件序列)

[5] WorldCat Place(地点)

  • – WorldCat Administrative Area (Place) (行政区域(地点),同时是团体子类 = Administrative Area (Organization))
  • – WorldCat Landform(地形地貌)

[6] WorldCat Work(作品)

  • – WorldCat Cartographic Material(地图资料)
  • – WorldCat Collection(文集)【组织形式】
  • — WorldCat Archival Collection (Collection)(档案集)
  • — WorldCat Continuing Resource (Collection)(连续性资源)
  • — WorldCat Integrating Resource (Continuing Resource)(集成资源)
  • — WorldCat Serial (Continuing Resource)(连续出版物)
  • — WorldCat Festschrift (Collection)(纪念文集)
  • — WorldCat Series (Collection)(丛编)
  • – WorldCat Data Set(数据集)
  • – WorldCat Interactive Resource(交互资源)【计算机程序/软件的细化。游戏?】
  • – WorldCat Software
  • – WorldCat Fictional Entity(虚构实体)【体裁?】
  • – WorldCat Image(图像)
  • — WorldCat Moving Image (Image)(动态图像)
  • — WorldCat Still Image (Image)(静态图像)
  • – WorldCat Notated Movement
  • – WorldCat Notated Music
  • – WorldCat Sound(声音)【未细分口语】
  • — WorldCat Music (Sound)(音乐)
  • – WorldCat Physical Object
  • – WorldCat Text
  • – WorldCat Website(网站)【集成资源特例】

【作品类比较】WorldCat作品有20多子类,接近BIBFRAME的作品子类,含RDA内容类型和组织形式2个方面:

主要差异(不免想起标准牙刷说……

  • 1、声音/音频:RDA有3类(声音、表演音乐、口语),WCO有2类(声音、音乐),BF只有1类(音频)。
  • 2、WCO增加的类:虚构实体(当指虚构类作品,非指LRM所说的虚构人物)。
  • 3、WCO细化的类:网站(RDA属集成资源),交互资源(软件的细化,如游戏?)。
  • 4、WCO的文集:对应于组织形式,其子类更多(如档案、纪念文集等)。

参见:BIBFRAME作品与实例的子类(及与RDA/MARC21的对照)(2024-6-14)

OCLC推出Meridian(WorldCat实体集成服务工具)

OCLC推出了WorldCat实体集成服务工具Meridian(子午线),这是图书馆传统编目规范库服务的关联数据升级版(这样描述只是为便于理解,肯定大大低估了其作用意义,详后附)。

这个工具应该是2020-2021年梅隆基金项目的成果,可参见:OCLC获梅隆基金资助开发实体管理基础设施(2020-1-11)/posts/2020/0111/5274。以Meridian介绍与项目宣布时信息对比,完成了实体标识符(URI)、关联现有规范档和外部词表、聚合实体的元数据描述,访问方式编辑和(6个)API;设想的实体类型有扩大,除人物和作品外,增加了地点和事件;使用模式设想有免费+订购,免费的访问选项在目前的介绍中没有提及;致谢除LD4之外,还包括Bibframe、PCC、RDA等20多个相关组织。

— 相关信息 —

上篇博文介绍“OCLC报告:关联数据,图书馆编目的未来”(/posts/2024/0626/6261):Linked data: The future of library cataloging。报告比较实质性的内容是提到OCLC今年1月推出的产品Meridian。年初的新闻稿(OCLC linked data services transform metadata management and connect library resources to wider knowledge streams. 2024-1-30.  https://www.oclc.org/en/news/releases/2024/20240130-linked-data.html)介绍OCLC将WorldCat实体标识符添加到WorldCat记录中,并将关联数据[链接数据]功能集成到图书馆已使用的编目服务,但并未提及产品名称,只给了一个更新后的OCLC关联数据网页的链接,有中文版:oc.lc/linkeddata(链接数据:下一代图书馆元数据),其中一节:介绍 OCLC Meridian®

“Meridian 是一款 WorldCat Entities™ 链接数据管理工具和 API 套件,支持创建和管理链接数据实体和描述性关系。通过与 MARC 记录中的现有值和全球信息生态系统中的其他数据集建立连接,丰富您的元数据。”

点击其后的“了解更多”,是产品主页,有各种详尽信息。中文版:Meridian——创建、管理和连接链接数据实体,提高元数据的可见性 https://www.oclc.org/zh-Hans/meridian.html(摘录附后)。

上个月(2024年5月)似乎产品正式上线可用了,又有一篇新闻,中文版:OCLC Meridian 使图书馆能够创建链接数据,将资源与更广泛的网络连接起来. 2024-5-9. https://www.oclc.org/zh-Hans/news/releases/2024/20240507-introducing-oclc-meridian.html 

本报道有较详细介绍,还有比产品主页更多的信息,如:

  • Meridian 提供了一套 API,使用户能够大规模创建和管理链接数据;查找不同图书馆来源的标识符(如 VIAF、ISNI、ORCID、ROR 等)以及通用知识图谱中的标识符(如 Wikidata 或 MusicBrainz)。
  • Meridian 的发布是 OCLC 长期链接数据战略的一个重要里程碑。

— Meridian 产品主页摘录 —

OCLC Meridian® 是一款直观的网络应用程序和一组 API,允许图书馆创建、管理和连接链接数据实体。通过与 MARC 记录中的现有值和全球信息生态系统中的其他数据集建立连接,丰富您的元数据。

  • 提高图书馆的可检索性和与用户的相关性……
  • 将链接数据管理集成到现有工作流程——有了 Meridian,您无需一次性“全面投入”。您可以根据自己的图书馆或组织的实际情况促进这一过程,无需干扰现有的工作流程。使用网络应用程序逐个创建、管理和连接 WorldCat 实体数据,或使用 API 套件轻松转换和大规模利用现有元数据。
  • 发现、强调和分析重要关系……
  • 为建立可扩展、可持续的链接数据网络做贡献……
  • 利用 API 轻松转换和大规模利用现有元数据——开发人员可以利用可提供不同级别编程访问的 WorldCat 实体 API 套件。

实体管理 API:创建和管理 WorldCat 实体链接数据

实体搜索 API:搜索与现有描述性元数据相匹配的标识符

实体变更 API:了解 WorldCat 实体数据的变更

PID 查找 API:连接多个词汇表中的永久标识符 (PID)

实体连接 API:检索相关数据子集,供本地检索应用程序使用

实体查询 API:查询整个 WorldCat 实体数据集

  • (最后)为什么选择 Meridian?Meridian 是图书馆实现链接数据的重要一步。

-将 MARC 编目和其他数据集与现有工作流程集成

连接不同词汇表和规范(如 ORCID 和 VIAF)的标识符

-可作为独立服务或 OCLC 编目订阅的附加服务在全球范围内提供

-与 OCLC 社区中心不断壮大的元数据专业人员合作