《BIBFRAME:发展与应用》问答补充

昨天(2023-2-15)在上海图书馆东馆乐享厅讲《BIBFRAME:发展与应用》。

参见文化和旅游研究上海图书馆基地:【讲座预告】胡小菁《BIBFRAME:发展与应用》|“智慧图书馆技术应用讲座”2023年第2期开放报名预约(2023-02-08)

这是智慧图书馆技术应用讲座第18期,因为先前几年COVID-19的影响,好像是本系列讲座首次开放现场参与。相较于网上300人报满,现场只有小数十人,显然大家已经习惯于网上参会了。

感谢智慧图书馆技术应用联盟的邀请,让我得以全面回顾BIBFRAME的发展过程,并与大家分享。视频回放和PPT在联盟网站(云瀚)及相关社交媒体网站也将发布。

昨天下午看了视频直播回放,对问答阶段自己的回复相当不满意。其实也是向来如此,自己特别不擅长应对,缺少娓娓道来、旁征博引的从容,总想着言简意赅、用几句话结掉问题。有的可能对提问的理解还存在偏差。以下试对现场回答再作些补充。

1、音乐资源【问题】BibFrame和schema.org各自的特点和优势?目前我们基于图书馆做国内音乐音像、乐谱等资源的语义网建设尝试,是Bibframe的拥趸,但在中途,发现国外(北美)的音乐图书馆link项目目前主要基于schema.org、RDA等。如果未来有可能国际对话、接轨,如何调和这两个方案之间的“差异”或形成互补?

【补充回答】我对音乐了解很少,前几天还在纠结音乐作品各种编号的中文对应名称。选什么词表,schema.org还是bibframe或其他,首先是要分析各词表定义的元素(类和属性),是不是足以涵盖本项目想要揭示的内容。因为没有做过schema和bf音乐相关元素的比对,所以无法给出意见。不过,大部分情况下单一词表都是不够的,需要扩展,可以用应用纲要的形式,纳入不同词表的元素,印象中瑞典国家图书馆的系统在bf以外也使用schema。不知道北美的这些音乐项目是什么时候开始建设的,如果在BF2之前,不采用BF是可以想见的。另外使用BF肯定需要扩展,可参考如LD4P对BF的扩展“演奏音乐本体”(PMO)。其次,选词表需要考虑其权威性、通用性、持久维护性等,现在来讲,schema.org和bf在这方面都没什么问题。

2、BF是否适用于细粒度描述,如目次、全文中实体。

【补充回答】BF是书目描述,目次没问题,但不适合揭示全文。面向全文的格式如TEI(Text Encoding Initiative)之类更合适。前几年参加中国索引学会,曾写了一篇文章《面向电子书的书后索引编制法——以地方志为例》,论及TEI。

3、科普MARC、BF和RDA三者关系。

【补充回答】以前的报告或培训中,多次以填表格做比喻,讲述两者间关系:MARC和BF作为结构标准,相当于那张表(各种要填写的项目);RDA作为内容标准,相当于填表说明(哪个项目应该怎么填写、取哪个值等等)。另可参见博文:元数据和编目标准类型(2014-5-8)

4、CALIS推广BIBFRAME问题

【补充回答】应该说联合目录没有听说有使用BF计划;其他项目不了解。

5、BIBFRAME对FOLIO的挑战【没有补充】

6、对编目客户端的影响

【补充回答】可以借鉴BIBFRAME编辑器的功能,改进现有marc客户端。目前基本上是“录入”型的,可以借鉴bf编辑器的模式,对规范控制和取值词表字段/子字段采用查询输入方式,提高工作效率、减少拼写错误。

7、BIBFRAME在我国推广的前景(唯一现场提问)

【补充回答】除了特藏,如本PPT第2部分“应用”所举例子,在整合图书馆资源与服务、发现界面方面,也会有应用前景。

EBSCO推出BiblioGraph(Library.Link改名?)

2022年12月,EBSCO宣布推出BiblioGraph,应用关联数据技术,让用户可以在Web上的任何地方查找和使用在线图书馆资源:

“BiblioGraph 利用 BIBFRAME 将图书馆目录转换为使用来自权威来源数据的关联数据资源——在图书馆目录中建立连接以显示相关的人、主题、单件、出版商等,允许用户在网络上查找和使用他们图书馆的资源。图书馆员工可以通过自动报告跟踪使用统计数据,展示人们使用 BIBFRAME 来使用图书馆目录的频率。

“当学术、国家或公共图书馆订阅 BiblioGraph 时,该机构会自动将数以千计的其他图书馆加入关联数据网络,该网络可用于打开 Google 等搜索网站,链接回图书馆并扩大知名度。自 2017 年与谷歌整合以来,这些技术的影响力在全球范围内不断扩大。2020 年,谷歌扩大了其借阅行动以包括更多服务。此后,BiblioGraph 将图书馆目录连接到谷歌在美国、加拿大和澳大利亚的知识面板,其他国家的图书馆也开始参与。”

2023年1月,EBSCO又宣称BiblioGraph提高了英国图书馆资源的可见性,包括在谷歌的知识面板和谷歌图书中找到借阅选项。

话说2020年,EBSCO收购了曾为美国国会图书馆(LC)开发BIBFRAME的Zepheira。Zepheira旗下使用BIBFRAME、把图书馆目录(MARC格式)和图书馆服务信息等转换为关联数据发布,方便通过搜索引擎等网络发现的服务Library.Link由此属于EBSCO。

Library.Link与谷歌知识图谱结合,到2021年已在美国、加拿大和澳大利亚3国的谷歌搜索和谷歌图书中提供图书馆借阅选项,现在英国加入成为第4国

从功能上看,BiblioGraph似乎就是Library.Link。以上两篇新闻稿中都提到这是“EBSCO 在 2020 年收购 Zepheira 的直接结果”,但都没有提及Library.Link。

在EBSCO网站上搜索新推出的BiblioGraph,有百多个结果,但搜索Library.Link,只有2个结果。EBSCO是给Library.Link改名BiblioGraph吗?

在某个NoveList产品介绍(BiblioGraph NoveList Enrichment)中有这样一段:“我们的许多客户使用BiblioGraph,它将您现有的数据转换为关联数据格式,并将其发布到 library.link 网络。这使得像谷歌这样的搜索引擎更容易在搜索结果中查找和显示您的图书馆资源”。似乎以BiblioGraph作为产品名,保留library.link作为网站名?

参见:

扩展都柏林核心:学术资源应用纲要(DC-SRAP)

2021年初,芬兰国家图书馆(NLF)提出为描述学术资源而扩展都柏林核心(DC),开发“学术资源应用纲要”(SRAP或DC-SRAP)。

NLF的理由是:DC常用于描述学位论文和高等教育机构的其他资源,用于存储并通过其机构存储库提供。但DC元数据术语本身不包含对这些资料进行简单描述所需的所有核心元数据元素,因此出现了不同的本地扩展。由此产生的负面影响包括:为相同目的开发多个模型所涉及的重复工作,工具(编目和搜索、指南)需要额外的开发工作,减少了使用不同模型创建的元数据之间的语义互操作性,DC元数据术语的实用性降低。为使DC成为一个更有价值的工具,促进DC用于学术著作的描述,NLF建议开发学术资源应用纲要(SRAP)。NLF认为,采用SRAP不仅将使DCMI元数据术语的扩展能够利用新增属性,完善许多现有属性的语义,而且还能减少开发其他本地学术著作的需求(Scholarly resources and Dublin Core, 2021-1-8)。建议并附上了SRAP草案(目前是2021-07-19的版本0.76)【访问Google文档

SRAP主要开发者是2位NLF的DCMI成员Juha Hakala和Osma Suominen。日前在GitHub上放出了新的SRAP草案:

都柏林核心元数据倡议学术资源应用纲要(2022-10-6 草案)

Dublin Core Metadata Initiative Scholarly Resources Application Profile (SRAP) (Draft 2022-10-06)

当前版本针对学术论文、学位论文等,暂不包括研究数据,但有相关代码、相关数据集等属性。学术论文,增加了编者、资助者、资助号,发布状态(公开草案、预印本、印后本、出版、更新出版)及相关日期(如手稿收到日期、撤回日期等),呈现于(会议)等;学位论文,增加了隶属关系、导师、评审者、答辩主持人等。

新增属性除扩展DC外,还有来自现有词表:

Affiliation 隶属关系,schema.org属性https://schema.org/affiliation

Date retracted 撤回日期,Fabio元数据术语http://purl.org/spar/fabio/hasRetractionDate

以及MARC21关系词(MARC relator)

Editor 编者:https://id.loc.gov/vocabulary/relators/edt

Funder 资助者:https://id.loc.gov/vocabulary/relators/fnd

Degree supervisor 学位导师:http://id.loc.gov/vocabulary/relators/dgs

Opponent 评审者:http://id.loc.gov/vocabulary/relators/opn

Praeses 主持人/答辩主席:http://id.loc.gov/vocabulary/relators/pra

然而,美国国会图书馆(LC)的MARC 21关系词属于责任者(creator / contributor)的角色,在定义上是SKOS概念(名词)、用于取值(宾语),并非属性(动词、谓语)。Karen Coyle在BIBFRAME邮件组提出“LC关系词作为属性”的问题(LoC Relators as Properties),其中特别提到RDA将关系词定义为“行为者”属性【新RDA将原“关系说明语”改为“属性”】,瑞典国家图书馆也基于LC关系词创建相应的属性列表。从讨论看,大家都赞同将关系词作为属性;但LC在BIBFRAME实现中仍使用关系词作为角色概念。

[update 2022-12-5] LC的Kevin Ford于12月2日在邮件组中回复,说明LC同时声明关系词为取值和属性,但属性声明由于不明原因删除,现已恢复。

对回复邮件的理解后简述如下(含个人理解,不保证符合原意):

约2017年,LC和DCMI把[行为者]关系词映射到dc:contributor[作为下位属性]。2010年LC发布关联数据服务ID.loc.gov,关系词同时发布为取值[MADS规范+SKOS概念]与属性[RDF+OWL],但不知何时属性声明被误删、现已恢复。LC作过测试,认为既作为名词[主语/宾语=取值]也作为动词[谓语=属性]没有问题。BF的关系词由1.0属性到2.x变为对象(间接方法),主要原因是可以对关系做更多陈述,如同schema.org引入角色[作为对象](可以连接不同属性)。对于LC双重定义的资源,[是作为取值还是作为属性],社区可以各取所需。