EBSCO推出BiblioGraph(Library.Link改名?)

2022年12月,EBSCO宣布推出BiblioGraph,应用关联数据技术,让用户可以在Web上的任何地方查找和使用在线图书馆资源:

“BiblioGraph 利用 BIBFRAME 将图书馆目录转换为使用来自权威来源数据的关联数据资源——在图书馆目录中建立连接以显示相关的人、主题、单件、出版商等,允许用户在网络上查找和使用他们图书馆的资源。图书馆员工可以通过自动报告跟踪使用统计数据,展示人们使用 BIBFRAME 来使用图书馆目录的频率。

“当学术、国家或公共图书馆订阅 BiblioGraph 时,该机构会自动将数以千计的其他图书馆加入关联数据网络,该网络可用于打开 Google 等搜索网站,链接回图书馆并扩大知名度。自 2017 年与谷歌整合以来,这些技术的影响力在全球范围内不断扩大。2020 年,谷歌扩大了其借阅行动以包括更多服务。此后,BiblioGraph 将图书馆目录连接到谷歌在美国、加拿大和澳大利亚的知识面板,其他国家的图书馆也开始参与。”

2023年1月,EBSCO又宣称BiblioGraph提高了英国图书馆资源的可见性,包括在谷歌的知识面板和谷歌图书中找到借阅选项。

话说2020年,EBSCO收购了曾为美国国会图书馆(LC)开发BIBFRAME的Zepheira。Zepheira旗下使用BIBFRAME、把图书馆目录(MARC格式)和图书馆服务信息等转换为关联数据发布,方便通过搜索引擎等网络发现的服务Library.Link由此属于EBSCO。

Library.Link与谷歌知识图谱结合,到2021年已在美国、加拿大和澳大利亚3国的谷歌搜索和谷歌图书中提供图书馆借阅选项,现在英国加入成为第4国

从功能上看,BiblioGraph似乎就是Library.Link。以上两篇新闻稿中都提到这是“EBSCO 在 2020 年收购 Zepheira 的直接结果”,但都没有提及Library.Link。

在EBSCO网站上搜索新推出的BiblioGraph,有百多个结果,但搜索Library.Link,只有2个结果。EBSCO是给Library.Link改名BiblioGraph吗?

在某个NoveList产品介绍(BiblioGraph NoveList Enrichment)中有这样一段:“我们的许多客户使用BiblioGraph,它将您现有的数据转换为关联数据格式,并将其发布到 library.link 网络。这使得像谷歌这样的搜索引擎更容易在搜索结果中查找和显示您的图书馆资源”。似乎以BiblioGraph作为产品名,保留library.link作为网站名?

参见:

美国国会图书馆:2023关联数据职位招聘

【白日梦】今天午睡,不知为何久睡到被唤醒,梦中情景历历在目……我向某人转述美国国会图书馆(LC)招聘信息:其一,接种新冠疫苗要求;其二,对职位的要求,当然首先是胜任各项工作,然后我让他猜学历要求是什么。他猜不出,我告诉他:没有任何要求。然后我就感慨,在吾国多小的机构招聘也是动则硕士博士的,LC竟然不要任何文凭。

午睡做梦而又清楚记得,本来少见,而梦境又过于真实,让我怀疑是梦还是非梦?起床问上午不在家的某人,是否和他说过LC招聘的事?没有。于是复述梦中其一其二,同样让他猜,他直接说猜不出。听说没有任何要求后,他表示质疑:他们不是有学校资格认证的吗?——做图书馆员是要有资格认证学校的学位,但技术人员没有这种限制啊。

附:[BIBFRAME] Job opportunity: 2 Linked Data positions at LC / Keven Ford. 2023-1-10 

上午在BIBFRAME邮件组看到LC有2个关联数据职位正在招聘——元数据应用的关联数据应用技术分析师,主要涉及书目框架BIBFRAME和关联数据服务id.loc.gov,也涉及其他标准如MODS、MADS、MIX、ALTO等XML模式,并为其他如PREMIS、METS、VRA提供维护服务。“我们大量使用XML技术、特别是XQuery和XSLT,但我们使用的更多,包括Python、NodeJS、Javascript、bash和SPARQL。我们利用XML数据库、MongoDB、Docker等”。

出于好奇,去看了美国政府官方网站USAJOBS上的招聘要求:Librarian (Linked Data Applications Technical Analyst)。头部最醒目的是新冠病疫苗接种要求(COVID-19 Vaccination Requiremen),说明目前对联邦雇员已没有普遍要求,但可能有些工作可能要求接种。条件的教育部分,说明“这份工作没有学历要求”(This job does not have an education qualification requirement.)。或许计算机奇才没学历很常见吧……

Wikidata的图书-版本两层结构(属性清单)

参见:Wikidata的数据类型及属性(2022-9-7)

Wikidata(维基数据)是Wikimedia旗下的免费知识库,拥有近1亿数据项(2022-9-7当下为 99,164,932 项)。作为一个关联数据源,Wikidata得到海外图书馆的利用,图书馆界也为Wikidata贡献数据。

2022年夏秋,LD4维基数据亲和组(LD4 Wikidata Affinity Group)正举办名为Wikidata Working Hours的系列活动。活动共10次,针对Wikidata中的儿童图书条目。使用威斯康星大学麦迪逊分校合作儿童图书中心的数据,让参与者尝试不同的 Wikidata 相关技能和工具。涵盖的主题包括:使用 OpenRefine 清理数据,使用 OpenRefine 协调数据,为个人作者、团体实体和作品/版本创建项(item),使用 OpenRefine 和 QuickStatements 批量上传项,以及编写 SPARQL 查询。

9月2日的第5次活动(Wikidata:WikiProject LD4 Wikidata Affinity Group/Wikidata Working Hours/Wikidata Working Hour Summer-Fall Project 2022/2022-September-2 Wikidata Working Hour)是用现有的儿童图书元数据电子表格,在 Wikidata 中创建作品和版本的数据项。

项(或数据项)相当于条目,其主要内容是一系列声明/语句(Statements),由属性+取值组成。活动页面分别列出了作品、版本及涉及的丛编对应的 Wikidata 属性(标识符为以P起首的数字),清单如下(应该只是常用而非完整属性):

作品基本语句(这些属性用于在 FRBR作品级别 表示一本书的项。作品应该是书面作品(Q47461344)的实例。作品的标签应该是题名,题名中大写的字母在 Wikidata 标签中是大写的。作品描述通常包括作品的形式和作者。)【中文名称取自Wikidata属性页中的简体中文[方括号中为自译];以下数据类型Item省略不注】

  • instance of 隶属于[…的实例](P31)取值:written work 
  • title 标题[题名](P1476,数据类型Monolingual text
  • author 作者(P50)当Wikidata项未知或不存在时使用author name string 作者姓名字符串(P2093,数据类型String
  • editor 编辑者(P98)
  • language of work or name 作品或名称的语言(P407)
  • has edition or translation 版本[有版本或译本](P747)
  • form of creative work 作品形式(P7937)
  • part of the series 所属系列[丛编](P179)

作品可选语句

  • genre 类型[体裁](P136)
  • main subject 作品主题(P921)
  • follows 之前是[先前](P155)followed by 之后是[后继](P156)
  • 【以下数据类型External identifier:分类法、作品ID】
  • Dewey Decimal Classification (P1036)Library of Congress Classification(P1149)Chinese Library Classification(P1189)Universal Decimal Classification(P1190)
  • OCLC work ID(P5331)Open Library ID(P648)LibraryThing work ID(P1085)Goodreads work ID(P8383)Babelio work ID(P3631)

版本基本语句(这些属性用于在 FRBR 内容表达/载体表现级别 表示一本书版本的项。 一本书的每个版本都应该有一个单独的维基数据项;如果内容(前言、后记、插图)、页码(页码)、出版商或出版地点发生变化,则应为该版本创建一个新项目;如果一本书是以前版本的相同再版(上述属性没有变化),则不需要新项目[特别注意:出版时间不在其列]。版本标签应该是书名。书名中大写的字母在 Wikidata 标签中是大写的。版本说明通常包括版本和作者的形式,以及与作品的区别,如出版日期、版本或插图画家。版本应该是version, edition, or translation (Q3331189)的实例。)【以下数据类型Item省略不注】

  • instance of(P31)取值:version, edition, or translation
  • edition or translation of(P629)
  • language of work or name(P407)
  • author(P50)P2093同作品
  • editor(P98)
  • illustrator(P110)
  • title(P1476,数据类型Monolingual text)subtitle(P1680,数据类型Monolingual text
  • edition number(P393,数据类型String
  • publisher(P123)publication date(P577,数据类型Point in time[即Time]
  • ISBN-10(P957,数据类型External identifier)ISBN-13(P212,数据类型External identifier

版本可选语句

  • translator(P655)
  • number of page(P1104,数据类型Quantity)
  • 【以下数据类型External identifier:图书ID】
  • SUDOC editions(P1025)K10plus PPN ID(P6721)EUL editions(P1084)BN (Argentine) editions(P1143)DNB editions(P1292)OCLC control number(P243)Open Library ID(P648)Google Books ID(P675)Internet Archive ID(P724)Project Gutenberg ebook ID(P2034)Bibliothèque nationale de France ID(P268)English Short Title Catalogue ID(P3939)Czech National Bibliography ID(P3184)Library of Congress Control Number (LCCN) (bibliographic)(P1144)RSL scanned books identifier
  • (P1815,数据类型String [未列入External identifier属性])

Series 所属系列[丛编]

  • instance of(P31)written work
  • title(P1476,数据类型Monolingual text)
  • author(P50)
  • publisher(P123)
  • has part(s)(P527)
  • genre(P136)

图书条目(作品或版本)即项(Item),其标识符为以Q起首的数字,其中的声明(Statements)默认三元组为:项(主体)+属性+取值(客体)。但如上所列属性,其中有数据类型非item的,比如文本title、时间publication date、外部标识符ISBN-13等,如何确定这些三元组的主体?有待了解。

参见实例:Snow Angel, Sand Angel / picture book by Ashley Lukashevsky,作品 Q113622633(https://www.wikidata.org/wiki/Q113622633),版本 Q113622573(https://www.wikidata.org/wiki/Q113622573

总结:Wikidata 采用作品-版本双层结构,其中作品对图书指 written work 书面作品(Q47461344),在条目的properties for this type部分列有如下属性:language of work or name,VIAF ID,genre。版本包括FRBR/LRM的内容表达和载体表现2个级别,指 version, edition, or translation 版本或译本(Q3331189),以expression、manifestation、adaptation等为其同义词,在本条目的properties for this type部分列有很多专用属性(可与上列属性清单对应)。