用BIBFRAME成本更高?(附WinISIS转换为MARC)

BIBFRAME项目启动已经过了12年,开发者美国国会图书馆(LC)仍未正式采用——对比MARC开发的8年,已经是1.5倍时间了。

昨天在BIBFRAME邮件组中,圣保罗大学图书馆有人问,该校一学院有WinISIS数据库的旧格式数据没法迁移到MARC,既然现在可以由MARC到BIBFRAME转换,是不是也可以把WinISIS格式直接转成BIBFRAME。一直对BIBFRAME持怀疑态度的Jeff Edmunds先问圣保罗大学有没有从MARC迁移到BIBFRAME的计划,然后直接泼冷水:“正如我多年来一直指出的那样,从MARC到BIBFRAME的迁移并不是将元数据从一种格式转换为另一种格式的简单问题。它对书目元数据的创建、维护和共享方式进行了根本性的改革,这将是一个非常昂贵和资源密集的过程”。并引用Marshall Breeding在2022年11月一次演讲的话作为旁证。

见:Re: BIBFRAME Digest – 19 May 2023 to 21 May 2023 (#2023-31) / Edmunds, Jeffrey. 2023-5-22.【另:此贴也介绍了一个报告,用MarcEdit等由WinISIS转换到MARC:Migrating from WinISIS to Koha – a case study / Rocio Jordan, ByWater. kohaCon 2016.】

网上搜到Marshall Breeding的报告。从报告看,作为多年为专业期刊撰写图书馆自动化系统年度报告的专家,他从图书馆自动化系统角度分析现状,总体不看好BIBFRAME。最大的问题是转换成本,以及近十年普遍的编目减员。报告最后他甚至说,图书馆界外对BIBFRAME并无兴趣,和MARC一样。以下为部分笔记。

BIBFRAME和关联数据:系统准备状态 BIBFRAME and Linked Data: System Readiness / by Marshall Breeding. Presentation for the Linked Data for Libraries Users Group of the Midwest Collaborative for Library Services on November 3, 2022(油管视频,1小时)

论题:[1]图书馆系统市场现状。[2]BIBFRAME的准备:图书馆服务平台(LSP) vs 集成图书馆系统(ILS)。[3]全球书目生态系统:不同类型、不同地区的图书馆如何获取书目记录。[4]BIBFRAME用于发现。[5]BIBFRAME用于可发现性。

BIBFRAME的准备。资源管理模型(ILS vs LSP):目前基本上还没有原生支持BIBFRAME记录创建的系统,某些ILS可能永远不会强化BIBFRAME支持。

全球书目生态系统。高校馆:对BIBFRAME有强烈兴趣/尤其顶级研究馆,依赖声称支持BIBFRAME的LSP。公共馆和学校馆:对BIBFRAME兴趣缺缺,依赖不期望支持BIBFRAME的ILS。

预计BIBFRAME成本会更高吗?向BIBFRAME的过渡将涉及大量投资:技术开发、员工培训、文档等。在最初的过渡之后的许多年里,图书馆预计BIBFRAME的编目成本将大大高于MARC。在过去的十年里,图书馆的技术服务部门大幅缩减。RDA和BIBFRAME是在技术服务人员减少以及相关馆藏领域减少的情况下出现的。【生不逢时】

结论性观察

  • 以MARC格式表达的书目元数据将无限期持续;
  • BIBFRAME在大型高校和国家图书馆获得推进;
  • 这些馆所用LSP产品终会支持BIBFRAME作为原生编目环境(3-5年);
  • 公共、学校和专业馆[对BIBFRAME]很少或不采用或感兴趣;
  • 大多数馆所用ILS不太会支持BIBFRAME;
  • 全球书目交换依赖MARC;
  • 当前环境包含由MARC到BIBFRAME映射;
  • 任何未来环境必须支持BIBFRAME到MARC;
  • 图书馆背景外对BIBFRAME无兴趣。

另见:

《BIBFRAME:发展与应用》问答补充

昨天(2023-2-15)在上海图书馆东馆乐享厅讲《BIBFRAME:发展与应用》。

参见文化和旅游研究上海图书馆基地:【讲座预告】胡小菁《BIBFRAME:发展与应用》|“智慧图书馆技术应用讲座”2023年第2期开放报名预约(2023-02-08)

这是智慧图书馆技术应用讲座第18期,因为先前几年COVID-19的影响,好像是本系列讲座首次开放现场参与。相较于网上300人报满,现场只有小数十人,显然大家已经习惯于网上参会了。

感谢智慧图书馆技术应用联盟的邀请,让我得以全面回顾BIBFRAME的发展过程,并与大家分享。视频回放和PPT在联盟网站(云瀚)及相关社交媒体网站也将发布。

昨天下午看了视频直播回放,对问答阶段自己的回复相当不满意。其实也是向来如此,自己特别不擅长应对,缺少娓娓道来、旁征博引的从容,总想着言简意赅、用几句话结掉问题。有的可能对提问的理解还存在偏差。以下试对现场回答再作些补充。

1、音乐资源【问题】BibFrame和schema.org各自的特点和优势?目前我们基于图书馆做国内音乐音像、乐谱等资源的语义网建设尝试,是Bibframe的拥趸,但在中途,发现国外(北美)的音乐图书馆link项目目前主要基于schema.org、RDA等。如果未来有可能国际对话、接轨,如何调和这两个方案之间的“差异”或形成互补?

【补充回答】我对音乐了解很少,前几天还在纠结音乐作品各种编号的中文对应名称。选什么词表,schema.org还是bibframe或其他,首先是要分析各词表定义的元素(类和属性),是不是足以涵盖本项目想要揭示的内容。因为没有做过schema和bf音乐相关元素的比对,所以无法给出意见。不过,大部分情况下单一词表都是不够的,需要扩展,可以用应用纲要的形式,纳入不同词表的元素,印象中瑞典国家图书馆的系统在bf以外也使用schema。不知道北美的这些音乐项目是什么时候开始建设的,如果在BF2之前,不采用BF是可以想见的。另外使用BF肯定需要扩展,可参考如LD4P对BF的扩展“演奏音乐本体”(PMO)。其次,选词表需要考虑其权威性、通用性、持久维护性等,现在来讲,schema.org和bf在这方面都没什么问题。

2、BF是否适用于细粒度描述,如目次、全文中实体。

【补充回答】BF是书目描述,目次没问题,但不适合揭示全文。面向全文的格式如TEI(Text Encoding Initiative)之类更合适。前几年参加中国索引学会,曾写了一篇文章《面向电子书的书后索引编制法——以地方志为例》,论及TEI。

3、科普MARC、BF和RDA三者关系。

【补充回答】以前的报告或培训中,多次以填表格做比喻,讲述两者间关系:MARC和BF作为结构标准,相当于那张表(各种要填写的项目);RDA作为内容标准,相当于填表说明(哪个项目应该怎么填写、取哪个值等等)。另可参见博文:元数据和编目标准类型(2014-5-8)

4、CALIS推广BIBFRAME问题

【补充回答】应该说联合目录没有听说有使用BF计划;其他项目不了解。

5、BIBFRAME对FOLIO的挑战【没有补充】

6、对编目客户端的影响

【补充回答】可以借鉴BIBFRAME编辑器的功能,改进现有marc客户端。目前基本上是“录入”型的,可以借鉴bf编辑器的模式,对规范控制和取值词表字段/子字段采用查询输入方式,提高工作效率、减少拼写错误。

7、BIBFRAME在我国推广的前景(唯一现场提问)

【补充回答】除了特藏,如本PPT第2部分“应用”所举例子,在整合图书馆资源与服务、发现界面方面,也会有应用前景。

EBSCO推出BiblioGraph(Library.Link改名?)

2022年12月,EBSCO宣布推出BiblioGraph,应用关联数据技术,让用户可以在Web上的任何地方查找和使用在线图书馆资源:

“BiblioGraph 利用 BIBFRAME 将图书馆目录转换为使用来自权威来源数据的关联数据资源——在图书馆目录中建立连接以显示相关的人、主题、单件、出版商等,允许用户在网络上查找和使用他们图书馆的资源。图书馆员工可以通过自动报告跟踪使用统计数据,展示人们使用 BIBFRAME 来使用图书馆目录的频率。

“当学术、国家或公共图书馆订阅 BiblioGraph 时,该机构会自动将数以千计的其他图书馆加入关联数据网络,该网络可用于打开 Google 等搜索网站,链接回图书馆并扩大知名度。自 2017 年与谷歌整合以来,这些技术的影响力在全球范围内不断扩大。2020 年,谷歌扩大了其借阅行动以包括更多服务。此后,BiblioGraph 将图书馆目录连接到谷歌在美国、加拿大和澳大利亚的知识面板,其他国家的图书馆也开始参与。”

2023年1月,EBSCO又宣称BiblioGraph提高了英国图书馆资源的可见性,包括在谷歌的知识面板和谷歌图书中找到借阅选项。

话说2020年,EBSCO收购了曾为美国国会图书馆(LC)开发BIBFRAME的Zepheira。Zepheira旗下使用BIBFRAME、把图书馆目录(MARC格式)和图书馆服务信息等转换为关联数据发布,方便通过搜索引擎等网络发现的服务Library.Link由此属于EBSCO。

Library.Link与谷歌知识图谱结合,到2021年已在美国、加拿大和澳大利亚3国的谷歌搜索和谷歌图书中提供图书馆借阅选项,现在英国加入成为第4国

从功能上看,BiblioGraph似乎就是Library.Link。以上两篇新闻稿中都提到这是“EBSCO 在 2020 年收购 Zepheira 的直接结果”,但都没有提及Library.Link。

在EBSCO网站上搜索新推出的BiblioGraph,有百多个结果,但搜索Library.Link,只有2个结果。EBSCO是给Library.Link改名BiblioGraph吗?

在某个NoveList产品介绍(BiblioGraph NoveList Enrichment)中有这样一段:“我们的许多客户使用BiblioGraph,它将您现有的数据转换为关联数据格式,并将其发布到 library.link 网络。这使得像谷歌这样的搜索引擎更容易在搜索结果中查找和显示您的图书馆资源”。似乎以BiblioGraph作为产品名,保留library.link作为网站名?

参见: