EBSCO推出BiblioGraph(Library.Link改名?)

2022年12月,EBSCO宣布推出BiblioGraph,应用关联数据技术,让用户可以在Web上的任何地方查找和使用在线图书馆资源:

“BiblioGraph 利用 BIBFRAME 将图书馆目录转换为使用来自权威来源数据的关联数据资源——在图书馆目录中建立连接以显示相关的人、主题、单件、出版商等,允许用户在网络上查找和使用他们图书馆的资源。图书馆员工可以通过自动报告跟踪使用统计数据,展示人们使用 BIBFRAME 来使用图书馆目录的频率。

“当学术、国家或公共图书馆订阅 BiblioGraph 时,该机构会自动将数以千计的其他图书馆加入关联数据网络,该网络可用于打开 Google 等搜索网站,链接回图书馆并扩大知名度。自 2017 年与谷歌整合以来,这些技术的影响力在全球范围内不断扩大。2020 年,谷歌扩大了其借阅行动以包括更多服务。此后,BiblioGraph 将图书馆目录连接到谷歌在美国、加拿大和澳大利亚的知识面板,其他国家的图书馆也开始参与。”

2023年1月,EBSCO又宣称BiblioGraph提高了英国图书馆资源的可见性,包括在谷歌的知识面板和谷歌图书中找到借阅选项。

话说2020年,EBSCO收购了曾为美国国会图书馆(LC)开发BIBFRAME的Zepheira。Zepheira旗下使用BIBFRAME、把图书馆目录(MARC格式)和图书馆服务信息等转换为关联数据发布,方便通过搜索引擎等网络发现的服务Library.Link由此属于EBSCO。

Library.Link与谷歌知识图谱结合,到2021年已在美国、加拿大和澳大利亚3国的谷歌搜索和谷歌图书中提供图书馆借阅选项,现在英国加入成为第4国

从功能上看,BiblioGraph似乎就是Library.Link。以上两篇新闻稿中都提到这是“EBSCO 在 2020 年收购 Zepheira 的直接结果”,但都没有提及Library.Link。

在EBSCO网站上搜索新推出的BiblioGraph,有百多个结果,但搜索Library.Link,只有2个结果。EBSCO是给Library.Link改名BiblioGraph吗?

在某个NoveList产品介绍(BiblioGraph NoveList Enrichment)中有这样一段:“我们的许多客户使用BiblioGraph,它将您现有的数据转换为关联数据格式,并将其发布到 library.link 网络。这使得像谷歌这样的搜索引擎更容易在搜索结果中查找和显示您的图书馆资源”。似乎以BiblioGraph作为产品名,保留library.link作为网站名?

参见:

美国国会图书馆选择folio系统

一早在微信群看到上图刘炜馆长发消息,美国国会图书馆(LC)“已经选择了开源的FOLIO图书馆服务平台作为其下一代的图书馆管理系。正如你们中的许多人已经知道的那样,FOLIO的创新架构允许最大限度的灵活性和可扩展性,这将使该平台能够随着我们需求的变化而增长。图书馆的FOLIO实施将得到EBSCO FOLIO服务的支持。最重要的是,BIBFRAME是一个强制性要求,这意味着对BIBFRAME描述的创建、存储和索引的本地支持。对于BIBFRAME计划来说,这是一个重要的里程碑,也是一个令人兴奋的里程碑!”

消息应该来自LC网络开发与标准办公室主任Sally McCallum在BIBFRAME讨论组的邮件。从邮件链接到LC官网新闻。难得见到新闻稿中3位馆长同时发声,图书馆馆藏管理系统(图书馆服务平台)对图书馆的重要性不言而喻。第一阶段3年,看来LC要真正用上BIBFRAME还需要几年时间,但毕竟终于可以进入实施阶段了。全文翻译如下:

国会图书馆努力改变馆藏管理和访问 Library of Congress Launches Effort to Transform Collections Management and Access (2022-9-21)

国会图书馆已授予一项重要合同,以进一步开发和实施一个新的开源 IT 平台,该平台将彻底改变图书馆庞大的物理和数字馆藏的管理方式,并使公众、国会、本馆员工和其他机构可以访问。

新的图书馆馆藏访问平台软件应用程序将作为本馆馆藏管理运营的核心,将多个独立的 IT 系统连接到一个一站式商店,用于本馆馆藏的采访、描述、典藏和发现。

本馆与马萨诸塞州伊普斯威奇的 EBSCO信息服务公司签订了一份 IDIQ 合同,初始支出为 777 万美元。该平台开发的第一阶段将在三年内耗资 1040 万美元,以满足本馆运营的规模和复杂性,并可选择投资于其他供应商可以开发的额外组件,并且可能会超过三年的时间框架。

EBSCO 将量身定制社区开发的开源图书馆服务解决方案 FOLIO,以提供满足本馆 IT 需求和本馆用户需求的图书馆服务平台。

“这是我们实施以用户为中心的方法以将更多人与本馆馆藏联系起来的旅程中的一个里程碑,”国会图书馆馆长 Carla Hayden 说。“我们感谢国会对这一下一代系统的慷慨投资,这对本馆的数字化前进战略至关重要,该战略利用技术弥合地理鸿沟,扩大我们的范围并增强我们的服务。”

该平台将取代几个遗留的 IT 系统,并为本馆工作人员提供新的、更高效的工具和工作流程,以大规模管理不断增长的物理和数字馆藏。它将为研究人员提供简化的发现体验和访问高质量元数据的新方法。它还将启用BIBFRAME,这是本馆和合作组织正在开发的新书目描述标准,它使用关联数据模型使书目信息在图书馆社区内外更有用。

当该平台全面运行时,它将使用户能够对世界上最大的图书馆的大量馆藏进行全面搜索。该系统将拥有更先进的 IT 安全控制,并将适应不断发展的技术和不断增长的数字内容。

“国会图书馆长期以来一直在为图书馆界开发开放格式和标准方面发挥着关键作用。支持关联开放数据的开源解决方案将不仅为本馆员工和用户带来好处,还为全国其他机构提供支持”,负责发现和保存服务的副馆长 Kate Zwaard (associate librarian) 说。

“图书馆馆藏访问平台的实施是本馆的最高技术优先事项之一” ,图书馆馆藏和服务副馆长 Robin Dale (deputy librarian)说。“这个新系统将使本馆能够跟上技术变革的步伐,并使其能够灵活地容纳本馆管理和提供给用户的数字内容的范围。”

国会图书馆是世界上最大的图书馆,提供现场和在线访问美国的创意记录以及来自世界各地的大量资料。它是美国国会的主要研究机构,也是美国版权局的所在地。探索馆藏、参考服务和其他计划,并计划访问loc.gov在congress.gov访问美国联邦立法信息的官方网站;并在copyright.gov注册作者身份的创意作品。

Wikidata的数据类型及属性

Wikidata(维基数据)是Wikimedia旗下的免费知识库,拥有近1亿数据项(2022-9-7当下为 99,164,932 项)。

关于Wikidata(维基数据)

  • Wikidata 是一个免费且开放的知识库,可供人和机器阅读和编辑。
  • Wikidata 作为其姊妹项目(包括 Wikipedia、Wikivoyage、Wiktionary、Wikisource 等)的结构化数据的中央存储。
  • Wikidata 还为许多其他站点和服务提供支持,而不仅仅是 Wikimedia 项目! Wikidata 的内容在免费许可下可用,使用标准格式导出,并且可以与关联数据网上的其他开放数据集相互链接。

维基数据的项(item)在维基数据主命名空间中有对应页面,相当于一个条目(在维基数据中以Q起首的数字表示)。不同于维基百科为相同内容的不同语种建立不同文章,维基数据的项针对 Thing:“被用来代表人类知识中,包括主题、概念和对象的所有‘东西’”,“项是独一无二的。每个项都应该清晰地定义一个概念或者事物,或者一个清晰可识别的概念或事物的实例。比如,在维基数据,我们可以使项既是[星球]planet (Q634)的概念,又是星球的实例 Earth (Q2)。”

维基数据的项包含4个部分:

  • 1、标签和描述(多语种),同义词
  • 2、声明/语句(Statements),主要数据部分,由 属性+取值 组成,其中取值(客体)很多情况也是数据项,以标识符实现数据项间的相互链接。
  • 3、标识符(Identifiers),其他系统描述同一内容的条目(如图书馆目录、百科全书条目等等),相当于参见、链接到其他系统。
  • 4、Wikimedia系列(如Wikipedia维基百科的不同语种条目)。

为结构化维基媒体中的数据,Wikidata定义了庞大的属性(目前有10292个属性),分别归属17个数据类型,另有14个数据类型有待完成。以下为现有数据类型及其属性数量:

  • Commons media 共享媒体。参引Wikimedia Commons上的文件。【74属性】
  • Globe coordinate 地球坐标【12属性】(待计划属性中另有 Celestial coordinates 天空坐标)
  • Item 项/数据项。维基数据中给出标识符的现实世界对象(RWO)、概念或事件以及关于它的信息。每个项在维基数据主命名空间中都有对应页面。项的主要数据部分是关于该项的声明/语句的列表。项可被视为关联数据中三元组的主体部分。内部链接到另一个项。【1562属性】
  • Property 属性。指向属性的内部链接。【19属性】
  • String 字符串。不需要翻译成不同语言或数字格式的字符链、数字和符号。【324属性】
  • Monolingual text 单语文本。不翻译为其他语言的字符串。这种类型的字符串定义一次,并在所有语言中重复使用。典型用途是使用当地语言编写的地理位置实体名称、某种标识符、化学式或拉丁学名。【59属性】(待计划属性中有多语文本Multilingual text)
  • External identifier 外部标识符。表示外部系统中使用的标识符的字符串。 如果定义了“格式化URL”(属性P1630),将显示为外部链接。【7339属性】
  • Quantity 数量【636属性】
  • Time 时间。以格里高利或儒略历存储日期。【62属性】(待完成属性中另有Duration 持续时间,格式为 HH:MM:SS)
  • URL 一种通用的网址,用于标识某种外部资源,可能是某种外部网站的链接,或者是用于在某种专用资源中查找的标识符。【89属性】
  • Mathematical expression 数学表达式。显示为数学公式的格式化字符串。【36属性】
  • Geographic shape 地理形状【3属性】
  • Musical Notation 乐谱【6属性】
  • Tabular data 表格式数据【6属性】
  • Lexeme 词位【14属性】
  • Form 词形【7属性】
  • Sense 语义【16属性】

除了数量庞大的外部标识符属性(7339个,如图书馆员最熟悉的ISBN、ISSN、OCLC控制号、LC规范号、CALIS号、VIAF号,DOI、ISNI、CAS注册号等等),属性最多的就是数据项了,是声明/语句(Statements)中最通用的属性(1562个,以项为主体)。