RDA与BIBFRAME对话

RDA的理念之一是格式中立,不与特定元数据格式绑定。但由于目前编目主要采用MARC,因而与MARC的映射仍是RDA附录的重要内容。随着计划取代MARC的BIBFRAME开发逐渐进入应用阶段,如何让RDA能顺利地应用于BIBFRAME成为关注点。

在模型和元素层面,RDA和BF两者其实有很大差异。RDA遵循FRBR/LRM,采用4层WEMI模型,BF是3层。RDA采用LRM的实体和属性,类少、元素多,BF的类则几乎于属性数量相当。编目时似乎用类还是属性不是什么问题,毕竟BF编辑器提示用的就是RDA元素,但在技术层面实现时,估计会有各种问题——这是我个人的猜测。

作为2018年欧洲BIBFRAME研讨会的后续,在刚结束的2019年ALA年会上,RDA指导委员会(RSC)代表和欧洲BIBFRAME研讨会组委会进行了一场对话,涉及RDA和BF的关系及互操作,确定将开展短期和长期任务、并将继续开会和讨论。

此消息由美国国会图书馆网络开发与标准办公室(LC/NDMSO)主任Sally H. McCallum在BF邮件组中发布,并说明欧洲BIBFRAME研讨会组委会成员包含美国的国会图书馆网络开发与标准办公室、LD4P和Share-VDE。消息在RSC网站上也有发布。

比较有意思的是,多年来两家开发方一直没有公开的直接对话——而LC本身除了是BF唯一主导开发者,也是RDA开发的重度参与者。两条消息的标题差异似也耐人寻味。

RSC新闻:Conversation between RSC and BIBFRAME (2019-7-15)

BIBFRAME邮件组:Conversation about relationship between RDA and BIBFRAME / McCallum, Sally(2019-7-16)

参见:欧洲BIBFRAME研讨会(2019-3-29)

对《对ILS投标者的BIBFRAME期望》的意见

2018-8-22 德国国家图书馆 Lars Svensson 在BIBFRAME邮件组中,针对2018年2月《对ILS投标者的BIBFRAME期望》提出意见,认为应当提出“功能需求”而不是“技术要求”,并参考2013年BIBFRAME用例与需求,从不同方面举例。

原文件参见:2017 EBW:对ILS投标者的BIBFRAME期望(2019-4-3)

—— 对《对ILS投标者的BIBFRAME期望》的意见 ——
[BIBFRAME] Some comments on “BIBFRAME Expectations for ILS Tenders” / Lars Svensson (2018-8-22)

……我认为该文所采取的总体方向存在一些问题。我觉得它主要关注技术而功能要求太少。本文建议过渡,从范式(1)其中编目在MARC记录中直接完成,并且图书馆集成库系统(ILS)使用关系数据库(RDBM)存储编目和任何相关联的数据存储到另一范式(2)其中编目在RDF中完成(使用BIBFRAME数据模型),ILS使用三元组库来存储必要的信息。我想说的是,第一个假设未必是真实的(有相当长的一段ILS其中数据不使用RDBM存储,至少一些图书馆编目不通过创建或编辑MARC记录,但使用其他元数据格式,如果需要可以转换为MARC)。我还要说,对新系统范式的建议过于狭隘,甚至可能通过强制要求使用哪种技术来阻碍创新。例如,有一种称为图数据库的新兴技术,它允许以有趣的方式分析图中的数据,包括找到两个节点之间的最短路径,找到“孤岛”(图或子树未连接到图的任何其他部分)或松散连接的子树(例如仅由一条边连接的子树)。如果我们要求使用三元组库,则供应商将无法使用此技术,因此将失去实现有趣统计功能的可能性。在我看来,招标应该尽可能技术中立(至少在系统内部方面)。

那么招标要包含什么呢?
我的看法是它应该指定所需的功能。毕竟,有趣的是我们希望系统做什么(或者至少我们想要对系统做什么)。对于基于关联数据的系统,我能想到的非详尽列表将是【引用2013 BIBFRAME使用案例与需求,参见:BIBFRAME使用案例与需求(2014-10-26)】

– 系统必须能够以下列格式导入图书馆数据:
— MARC 21(多半有不同风味)【比如:德国的没有ISBD标识符?LC较少用连接字段?】
— 使用BIBFRAME数据模型的RDF
— 使用RDA数据模型的RDF
— …
– 系统必须能够以下列格式导出数据:
— MARC 21(多半有不同风味)
— 使用BIBFRAME数据模型的RDF
— DC-XML(用于OAI-PMH)
— …
– 系统必须支持下列导入和导出接口:
— SRU/SRW
— OAI-PMH(双向同步)
— Z39.50 😉
— W3C WebSub(确保系统是Web的)
— …
– 编目模块必须允许编目员:
— 将题名和规范连接到驻留在本地系统中的其他题名和规范(例如,连接出版物与其继承者或作者;连接作者与其出生地、出生地与其所属国家)
— 将题名和规范连接到驻留在联机数据库中的其他题名和规范(可能要求系统必须支持的搜索界面列表)
— …
– 系统必须允许管理者:
— 配置数据录入表单,如限制编目员可以使用哪个规范档
— 以标准化格式导入和导出数据录入配置和元数据纲要(可能说明此种格式清单,如SHACL, ShEx, JSON Schema, XML Schema……)
— 无缝包含第三方数据库(IEEE Xplore, EconBiz, PubMed, ………)到最终用户检索中
– 系统必须允许最终用户:
— 使用单一、统一搜索界面搜索图书馆内部内容和第三方数据库
— 导出书目引文到第三方引文管理系统
— 对匹配定制搜索的新内容订阅RSS/Atom源【推送】
— …
对我,此方法的优点是:
1) 客户需要考虑他们真正希望系统做什么
2) 供应商可以专注于以舒适的方式实现此功能,而不必专注于新技术。

Karen Coyle与Lars进行了一番互动,认为在关联数据的讨论中缺少内容:要做哪些链接?由此Lars对需求作了补充:
这让我想到了另一个重要的要求,我通常认为这是理所当然的,但这可能需要明确:
系统必须为系统中管理的所有实体公开可解引的URI。管理员还必须有一种方法可以为所有或某些类型的实体(例如,不得共享的资源)禁用此功能

2017 EBW:对ILS投标者的BIBFRAME期望

关于欧洲BIBFRAME研讨会(EBW),参见:
欧洲BIBFRAME研讨会(2019-3-29)
2018 EBW:就RDA与BIBFRAME致信RDA指导委员会(2019-4-2)
[update,对本文件的反馈: 对《对ILS投标者的BIBFRAME期望》的意见(2019-4-3)]

2017年欧洲BIBFRAME研讨会上讨论了对集成图书馆系统(ILS)实现关联数据模型的要求,尤其是应用BIBFRAME。由此2018年EBW组委会要求Tiziana Possemato(意大利数据/系统厂商 Casalini Libri – @cult)草拟规范《对ILS投标者的BIBFRAME期望》,作为2017 EBW成果。文件提出了ILS转向BIBFRAME/关联数据的不同级别,可作为招标需求。其中ILS主要指其编目模块,共定义了3个类型、逐步过渡到关联数据环境的10个级别。以下摘译“ILS的BIBFRAME一致性级别”部分。
注:其中提到主/从(技术):“一种通信模型,其中一个设备或进程对一个或多个其他设备具有单向控制。 在某些系统中,从一组符合条件的设备中选择一个主设备,其他设备扮演从设备的角色”

EBW-ILS

—— 对ILS投标者的BIBFRAME期望(摘录) ——
BIBFRAME Expectations for ILS Tenders (2018-02)
ILS的BIBFRAME一致性级别

以下一致性级别可分为三种不同类型:
a. 元数据生成/维护:1-8级
b. 发现:9级
c. 文档化/未来能力:10级
当图书馆提供更加成熟和明确的要求时,将来可以改进这些类型组中的每一个。

1. 第一级(入门级):ILS需要管理格式并能够生成“做得好”的数据(这意味着高质量的MARC数据),准备转换为BIBFRAME。该系统仍然处于传统环境中,但供应商已经改进了编目标准或格式,使传统MARC记录更易于转换。这些功能的一些示例是:
 管理对数据转换为BIBFRAME有用的属性和关系的可能性;
 使用RDA条款和指南进行编目的可能性;
 使用URI管理和丰富MARC记录的可能性;
 管理ILS级别的书目和规范记录之间的链接、使转换变得更加容易的可能性,因为系统确保了链接的一致性。
通常,任何提高数据质量的功能都有助于以后的转换。在这种情况下,编目模块完全面向记录

2. 供应商可以提供转换工具,能够转换为各种模型,包括BIBFRAME(从MARC/MODS …格式到关联数据),不包含在ILS中,但可用于转换数据。在这种情况下,编目模块完全面向记录,之后实现到BIBFRAME的转换。关系数据库为主、三元组库为从。

3. 供应商可以提供连接到ILS的BIBFRAME转换器:这意味着一次性实现海量数据转换,但系统应允许逐个记录RDF(BIBFRAME)数据集的更新。此外,系统应允许更新已经采用RDF格式的数据。在这种情况下,编目模块仍然完全面向记录,之后实现了对BIBFRAME的转换。关系数据库为主、三元组库为从。这两个环境应保持一致。这将使数据作为关联开放数据提供给外部应用程序以供使用。

4. ILS便于使用BIBFRAME编辑器,以在BIBFRAME中创建和编辑数据。供应商提供API层以将RDF数据转换并下载到关系数据库中(以传统格式)。在这种情况下,数据变为面向实体,并且它们被转换为传统格式,以允许使用传统数据的其他服务(用于流通等)。在这种情况下,主/从关系由“编辑器”确定(它可以有一个存储系统)。这将使数据作为关联开放数据提供给外部应用程序以供使用。

5. ILS有自己的BIBFRAME接口(在图中称为GUI),因此编目不再是面向记录的,而是面向实体的。系统在两个环境中同时管理两个不同的数据库(关系和三元组库)和每个编目操作(发出 – 编辑 – 删除 – 获取)更新。在这种情况下,主是三元组库,从是关系数据库。

6. 系统允许原始编目在RDF/BIBFRAME环境中进行。编目过程完全是面向实体的(关联开放数据环境);供应商提供API/Web服务以将系统与传统系统连接(转换和管理来自传统系统的数据)。没有必要拥有平行的传统环境,但图书馆希望与现有的传统环境保持联系。

7. 系统允许原始编目在RDF/BIBFRAME环境中进行。编目过程完全是面向实体的(关联开放数据环境),整个ILS很可能在RDF中生成和管理数据[或者情况可能并非如此,但这种情况不属于本文档的范围] 。没有理由拥有并行环境,因为完全实现了向新的关联开放数据环境的过渡。

8. 供应商将确保前面提到的工具/技术将考虑BIBFRAME的演变;特定组件将更新吸收BIBFRAME模型和词汇表中的更改,通过… [定义特定时间,例如从新BIBFRAME版本发布后一年]。

9. 供应商将提供一个发现工具,该工具能够为BIBFRAME提出的实体关系模型提供证据。面向OPAC/面向BIBFRAME的发现系统的详细信息需要本文档的另一部分(或其他特定文档)。就OPAC/发现工具而言,此列表并未全面展示前端系统的可能演变。如果没有以前的级别,则该级别不被视为更高级别的合规性,而是较低级别的合规性。

10. 供应商必须确保共享所有项目文件(技术和实践),以便将来在供应商的专属领域之外管理系统。