对《对ILS投标者的BIBFRAME期望》的意见

2018-8-22 德国国家图书馆 Lars Svensson 在BIBFRAME邮件组中,针对2018年2月《对ILS投标者的BIBFRAME期望》提出意见,认为应当提出“功能需求”而不是“技术要求”,并参考2013年BIBFRAME用例与需求,从不同方面举例。

原文件参见:2017 EBW:对ILS投标者的BIBFRAME期望(2019-4-3)

—— 对《对ILS投标者的BIBFRAME期望》的意见 ——
[BIBFRAME] Some comments on “BIBFRAME Expectations for ILS Tenders” / Lars Svensson (2018-8-22)

……我认为该文所采取的总体方向存在一些问题。我觉得它主要关注技术而功能要求太少。本文建议过渡,从范式(1)其中编目在MARC记录中直接完成,并且图书馆集成库系统(ILS)使用关系数据库(RDBM)存储编目和任何相关联的数据存储到另一范式(2)其中编目在RDF中完成(使用BIBFRAME数据模型),ILS使用三元组库来存储必要的信息。我想说的是,第一个假设未必是真实的(有相当长的一段ILS其中数据不使用RDBM存储,至少一些图书馆编目不通过创建或编辑MARC记录,但使用其他元数据格式,如果需要可以转换为MARC)。我还要说,对新系统范式的建议过于狭隘,甚至可能通过强制要求使用哪种技术来阻碍创新。例如,有一种称为图数据库的新兴技术,它允许以有趣的方式分析图中的数据,包括找到两个节点之间的最短路径,找到“孤岛”(图或子树未连接到图的任何其他部分)或松散连接的子树(例如仅由一条边连接的子树)。如果我们要求使用三元组库,则供应商将无法使用此技术,因此将失去实现有趣统计功能的可能性。在我看来,招标应该尽可能技术中立(至少在系统内部方面)。

那么招标要包含什么呢?
我的看法是它应该指定所需的功能。毕竟,有趣的是我们希望系统做什么(或者至少我们想要对系统做什么)。对于基于关联数据的系统,我能想到的非详尽列表将是【引用2013 BIBFRAME使用案例与需求,参见:BIBFRAME使用案例与需求(2014-10-26)】

– 系统必须能够以下列格式导入图书馆数据:
— MARC 21(多半有不同风味)【比如:德国的没有ISBD标识符?LC较少用连接字段?】
— 使用BIBFRAME数据模型的RDF
— 使用RDA数据模型的RDF
— …
– 系统必须能够以下列格式导出数据:
— MARC 21(多半有不同风味)
— 使用BIBFRAME数据模型的RDF
— DC-XML(用于OAI-PMH)
— …
– 系统必须支持下列导入和导出接口:
— SRU/SRW
— OAI-PMH(双向同步)
— Z39.50 😉
— W3C WebSub(确保系统是Web的)
— …
– 编目模块必须允许编目员:
— 将题名和规范连接到驻留在本地系统中的其他题名和规范(例如,连接出版物与其继承者或作者;连接作者与其出生地、出生地与其所属国家)
— 将题名和规范连接到驻留在联机数据库中的其他题名和规范(可能要求系统必须支持的搜索界面列表)
— …
– 系统必须允许管理者:
— 配置数据录入表单,如限制编目员可以使用哪个规范档
— 以标准化格式导入和导出数据录入配置和元数据纲要(可能说明此种格式清单,如SHACL, ShEx, JSON Schema, XML Schema……)
— 无缝包含第三方数据库(IEEE Xplore, EconBiz, PubMed, ………)到最终用户检索中
– 系统必须允许最终用户:
— 使用单一、统一搜索界面搜索图书馆内部内容和第三方数据库
— 导出书目引文到第三方引文管理系统
— 对匹配定制搜索的新内容订阅RSS/Atom源【推送】
— …
对我,此方法的优点是:
1) 客户需要考虑他们真正希望系统做什么
2) 供应商可以专注于以舒适的方式实现此功能,而不必专注于新技术。

Karen Coyle与Lars进行了一番互动,认为在关联数据的讨论中缺少内容:要做哪些链接?由此Lars对需求作了补充:
这让我想到了另一个重要的要求,我通常认为这是理所当然的,但这可能需要明确:
系统必须为系统中管理的所有实体公开可解引的URI。管理员还必须有一种方法可以为所有或某些类型的实体(例如,不得共享的资源)禁用此功能

2017 EBW:对ILS投标者的BIBFRAME期望

关于欧洲BIBFRAME研讨会(EBW),参见:
欧洲BIBFRAME研讨会(2019-3-29)
2018 EBW:就RDA与BIBFRAME致信RDA指导委员会(2019-4-2)
[update,对本文件的反馈: 对《对ILS投标者的BIBFRAME期望》的意见(2019-4-3)]

2017年欧洲BIBFRAME研讨会上讨论了对集成图书馆系统(ILS)实现关联数据模型的要求,尤其是应用BIBFRAME。由此2018年EBW组委会要求Tiziana Possemato(意大利数据/系统厂商 Casalini Libri – @cult)草拟规范《对ILS投标者的BIBFRAME期望》,作为2017 EBW成果。文件提出了ILS转向BIBFRAME/关联数据的不同级别,可作为招标需求。其中ILS主要指其编目模块,共定义了3个类型、逐步过渡到关联数据环境的10个级别。以下摘译“ILS的BIBFRAME一致性级别”部分。
注:其中提到主/从(技术):“一种通信模型,其中一个设备或进程对一个或多个其他设备具有单向控制。 在某些系统中,从一组符合条件的设备中选择一个主设备,其他设备扮演从设备的角色”

EBW-ILS

—— 对ILS投标者的BIBFRAME期望(摘录) ——
BIBFRAME Expectations for ILS Tenders (2018-02)
ILS的BIBFRAME一致性级别

以下一致性级别可分为三种不同类型:
a. 元数据生成/维护:1-8级
b. 发现:9级
c. 文档化/未来能力:10级
当图书馆提供更加成熟和明确的要求时,将来可以改进这些类型组中的每一个。

1. 第一级(入门级):ILS需要管理格式并能够生成“做得好”的数据(这意味着高质量的MARC数据),准备转换为BIBFRAME。该系统仍然处于传统环境中,但供应商已经改进了编目标准或格式,使传统MARC记录更易于转换。这些功能的一些示例是:
 管理对数据转换为BIBFRAME有用的属性和关系的可能性;
 使用RDA条款和指南进行编目的可能性;
 使用URI管理和丰富MARC记录的可能性;
 管理ILS级别的书目和规范记录之间的链接、使转换变得更加容易的可能性,因为系统确保了链接的一致性。
通常,任何提高数据质量的功能都有助于以后的转换。在这种情况下,编目模块完全面向记录

2. 供应商可以提供转换工具,能够转换为各种模型,包括BIBFRAME(从MARC/MODS …格式到关联数据),不包含在ILS中,但可用于转换数据。在这种情况下,编目模块完全面向记录,之后实现到BIBFRAME的转换。关系数据库为主、三元组库为从。

3. 供应商可以提供连接到ILS的BIBFRAME转换器:这意味着一次性实现海量数据转换,但系统应允许逐个记录RDF(BIBFRAME)数据集的更新。此外,系统应允许更新已经采用RDF格式的数据。在这种情况下,编目模块仍然完全面向记录,之后实现了对BIBFRAME的转换。关系数据库为主、三元组库为从。这两个环境应保持一致。这将使数据作为关联开放数据提供给外部应用程序以供使用。

4. ILS便于使用BIBFRAME编辑器,以在BIBFRAME中创建和编辑数据。供应商提供API层以将RDF数据转换并下载到关系数据库中(以传统格式)。在这种情况下,数据变为面向实体,并且它们被转换为传统格式,以允许使用传统数据的其他服务(用于流通等)。在这种情况下,主/从关系由“编辑器”确定(它可以有一个存储系统)。这将使数据作为关联开放数据提供给外部应用程序以供使用。

5. ILS有自己的BIBFRAME接口(在图中称为GUI),因此编目不再是面向记录的,而是面向实体的。系统在两个环境中同时管理两个不同的数据库(关系和三元组库)和每个编目操作(发出 – 编辑 – 删除 – 获取)更新。在这种情况下,主是三元组库,从是关系数据库。

6. 系统允许原始编目在RDF/BIBFRAME环境中进行。编目过程完全是面向实体的(关联开放数据环境);供应商提供API/Web服务以将系统与传统系统连接(转换和管理来自传统系统的数据)。没有必要拥有平行的传统环境,但图书馆希望与现有的传统环境保持联系。

7. 系统允许原始编目在RDF/BIBFRAME环境中进行。编目过程完全是面向实体的(关联开放数据环境),整个ILS很可能在RDF中生成和管理数据[或者情况可能并非如此,但这种情况不属于本文档的范围] 。没有理由拥有并行环境,因为完全实现了向新的关联开放数据环境的过渡。

8. 供应商将确保前面提到的工具/技术将考虑BIBFRAME的演变;特定组件将更新吸收BIBFRAME模型和词汇表中的更改,通过… [定义特定时间,例如从新BIBFRAME版本发布后一年]。

9. 供应商将提供一个发现工具,该工具能够为BIBFRAME提出的实体关系模型提供证据。面向OPAC/面向BIBFRAME的发现系统的详细信息需要本文档的另一部分(或其他特定文档)。就OPAC/发现工具而言,此列表并未全面展示前端系统的可能演变。如果没有以前的级别,则该级别不被视为更高级别的合规性,而是较低级别的合规性。

10. 供应商必须确保共享所有项目文件(技术和实践),以便将来在供应商的专属领域之外管理系统。

2018 EBW:就RDA与BIBFRAME致信RDA指导委员会

2018年欧洲BIBFRAME研讨会(EBW),与会者80人,来自17个欧洲国家及美国、加拿大和卡塔尔。作为会议成果,在2018年12月发出了一封给RDA指导委员会(RSC)的信,由丹麦皇家图书馆Leif Andresen署名,代表EBW组委会7人(其中包括负责BIBFRAME开发的美国国会图书馆网络和MARC标准办公室主任的Sally H. McCallum)。截至2019-4-3,RSC官网消息中未见回应——RSC通常每年11月举行年会,2019年预定在智利首都圣都亚哥。
参见:
会议网站:European BIBFRAME Workshop 2018 (2018.9.17-19)
介绍博文:欧洲BIBFRAME研讨会(2019-3-29)

—— 就RDA与BIBFRAME致信RDA指导委员会(译文) ——
Letter to the RDA Steering Committee about RDA and BIBFRAME (2018-12-13)

在Fiesole今年的欧洲BIBFRAME研讨会*期间,一再明确RDA用户和BIBFRAME用户之间存在很大的重叠。自其构想以来,RDA已经允许实施关联数据,现在其实现比以往任何时候都更加明显。在这种情况下,必须评估RDA和BIBFRAME之间的关系,以便允许使用两种标准的全部潜力
到目前为止,大多数RDA实现都基于MARC 21格式,而MARC21很可能会被BIBFRAME取代。我们正在迅速接近这一时刻,即RDA需要被BDAFRAME所用,或者和MARC格式同时、或作为MARC格式的替代品。然而,MARC 21和BIBFRAME都无法满足RDA的全部粒度——前者因为是在RDA之前的世界中建立的,后者是因为[RDA]范围超出了专门的图书馆应用。
BIBFRAME的概念模型与FRBR或IFLA LRM并不完全一致,而IFLA LRM确实构成了3R后工具包的基础。同样,RDA关注解析(粒度)和记录选项,而BIBFRAME关注关系和链接,已经迫使BIBFRAME实施要仔细评估其数据模型的某些粒度和方面的目的和必要性。 RDA描述要包括在描述中的数据,但不一定建议单独识别每个元素。在BIBFRAME中容纳RDA元素有很多选项,例如扩展,或者只选择那些已经很容易表示的元素。当然,在BIBFRAME研讨会期间,许多参与者心中的问题是:我们如何能够在原生BIBFRAME环境中实施RDA
新兴的BIBFRAME社区希望与RSC建立一个工作组,为在BIBFRAME内推荐的RDA表示制定一套指南。虽然这些指南不能是规定,但它们会代表一种标准化方法,既能确保图书馆之间最简单的数据交换,又能确保供应商可以建立服务的稳定表示。
我们期待听到RSC对这种方法的反应,并解决这个问题,以改善我们社区的两个部分。