对《对ILS投标者的BIBFRAME期望》的意见

2018-8-22 德国国家图书馆 Lars Svensson 在BIBFRAME邮件组中,针对2018年2月《对ILS投标者的BIBFRAME期望》提出意见,认为应当提出“功能需求”而不是“技术要求”,并参考2013年BIBFRAME用例与需求,从不同方面举例。

原文件参见:2017 EBW:对ILS投标者的BIBFRAME期望(2019-4-3)

—— 对《对ILS投标者的BIBFRAME期望》的意见 ——
[BIBFRAME] Some comments on “BIBFRAME Expectations for ILS Tenders” / Lars Svensson (2018-8-22)

……我认为该文所采取的总体方向存在一些问题。我觉得它主要关注技术而功能要求太少。本文建议过渡,从范式(1)其中编目在MARC记录中直接完成,并且图书馆集成库系统(ILS)使用关系数据库(RDBM)存储编目和任何相关联的数据存储到另一范式(2)其中编目在RDF中完成(使用BIBFRAME数据模型),ILS使用三元组库来存储必要的信息。我想说的是,第一个假设未必是真实的(有相当长的一段ILS其中数据不使用RDBM存储,至少一些图书馆编目不通过创建或编辑MARC记录,但使用其他元数据格式,如果需要可以转换为MARC)。我还要说,对新系统范式的建议过于狭隘,甚至可能通过强制要求使用哪种技术来阻碍创新。例如,有一种称为图数据库的新兴技术,它允许以有趣的方式分析图中的数据,包括找到两个节点之间的最短路径,找到“孤岛”(图或子树未连接到图的任何其他部分)或松散连接的子树(例如仅由一条边连接的子树)。如果我们要求使用三元组库,则供应商将无法使用此技术,因此将失去实现有趣统计功能的可能性。在我看来,招标应该尽可能技术中立(至少在系统内部方面)。

那么招标要包含什么呢?
我的看法是它应该指定所需的功能。毕竟,有趣的是我们希望系统做什么(或者至少我们想要对系统做什么)。对于基于关联数据的系统,我能想到的非详尽列表将是【引用2013 BIBFRAME使用案例与需求,参见:BIBFRAME使用案例与需求(2014-10-26)】

– 系统必须能够以下列格式导入图书馆数据:
— MARC 21(多半有不同风味)【比如:德国的没有ISBD标识符?LC较少用连接字段?】
— 使用BIBFRAME数据模型的RDF
— 使用RDA数据模型的RDF
— …
– 系统必须能够以下列格式导出数据:
— MARC 21(多半有不同风味)
— 使用BIBFRAME数据模型的RDF
— DC-XML(用于OAI-PMH)
— …
– 系统必须支持下列导入和导出接口:
— SRU/SRW
— OAI-PMH(双向同步)
— Z39.50 😉
— W3C WebSub(确保系统是Web的)
— …
– 编目模块必须允许编目员:
— 将题名和规范连接到驻留在本地系统中的其他题名和规范(例如,连接出版物与其继承者或作者;连接作者与其出生地、出生地与其所属国家)
— 将题名和规范连接到驻留在联机数据库中的其他题名和规范(可能要求系统必须支持的搜索界面列表)
— …
– 系统必须允许管理者:
— 配置数据录入表单,如限制编目员可以使用哪个规范档
— 以标准化格式导入和导出数据录入配置和元数据纲要(可能说明此种格式清单,如SHACL, ShEx, JSON Schema, XML Schema……)
— 无缝包含第三方数据库(IEEE Xplore, EconBiz, PubMed, ………)到最终用户检索中
– 系统必须允许最终用户:
— 使用单一、统一搜索界面搜索图书馆内部内容和第三方数据库
— 导出书目引文到第三方引文管理系统
— 对匹配定制搜索的新内容订阅RSS/Atom源【推送】
— …
对我,此方法的优点是:
1) 客户需要考虑他们真正希望系统做什么
2) 供应商可以专注于以舒适的方式实现此功能,而不必专注于新技术。

Karen Coyle与Lars进行了一番互动,认为在关联数据的讨论中缺少内容:要做哪些链接?由此Lars对需求作了补充:
这让我想到了另一个重要的要求,我通常认为这是理所当然的,但这可能需要明确:
系统必须为系统中管理的所有实体公开可解引的URI。管理员还必须有一种方法可以为所有或某些类型的实体(例如,不得共享的资源)禁用此功能

2017 EBW:对ILS投标者的BIBFRAME期望

关于欧洲BIBFRAME研讨会(EBW),参见:
欧洲BIBFRAME研讨会(2019-3-29)
2018 EBW:就RDA与BIBFRAME致信RDA指导委员会(2019-4-2)
[update,对本文件的反馈: 对《对ILS投标者的BIBFRAME期望》的意见(2019-4-3)]

2017年欧洲BIBFRAME研讨会上讨论了对集成图书馆系统(ILS)实现关联数据模型的要求,尤其是应用BIBFRAME。由此2018年EBW组委会要求Tiziana Possemato(意大利数据/系统厂商 Casalini Libri – @cult)草拟规范《对ILS投标者的BIBFRAME期望》,作为2017 EBW成果。文件提出了ILS转向BIBFRAME/关联数据的不同级别,可作为招标需求。其中ILS主要指其编目模块,共定义了3个类型、逐步过渡到关联数据环境的10个级别。以下摘译“ILS的BIBFRAME一致性级别”部分。
注:其中提到主/从(技术):“一种通信模型,其中一个设备或进程对一个或多个其他设备具有单向控制。 在某些系统中,从一组符合条件的设备中选择一个主设备,其他设备扮演从设备的角色”

EBW-ILS

—— 对ILS投标者的BIBFRAME期望(摘录) ——
BIBFRAME Expectations for ILS Tenders (2018-02)
ILS的BIBFRAME一致性级别

以下一致性级别可分为三种不同类型:
a. 元数据生成/维护:1-8级
b. 发现:9级
c. 文档化/未来能力:10级
当图书馆提供更加成熟和明确的要求时,将来可以改进这些类型组中的每一个。

1. 第一级(入门级):ILS需要管理格式并能够生成“做得好”的数据(这意味着高质量的MARC数据),准备转换为BIBFRAME。该系统仍然处于传统环境中,但供应商已经改进了编目标准或格式,使传统MARC记录更易于转换。这些功能的一些示例是:
 管理对数据转换为BIBFRAME有用的属性和关系的可能性;
 使用RDA条款和指南进行编目的可能性;
 使用URI管理和丰富MARC记录的可能性;
 管理ILS级别的书目和规范记录之间的链接、使转换变得更加容易的可能性,因为系统确保了链接的一致性。
通常,任何提高数据质量的功能都有助于以后的转换。在这种情况下,编目模块完全面向记录

2. 供应商可以提供转换工具,能够转换为各种模型,包括BIBFRAME(从MARC/MODS …格式到关联数据),不包含在ILS中,但可用于转换数据。在这种情况下,编目模块完全面向记录,之后实现到BIBFRAME的转换。关系数据库为主、三元组库为从。

3. 供应商可以提供连接到ILS的BIBFRAME转换器:这意味着一次性实现海量数据转换,但系统应允许逐个记录RDF(BIBFRAME)数据集的更新。此外,系统应允许更新已经采用RDF格式的数据。在这种情况下,编目模块仍然完全面向记录,之后实现了对BIBFRAME的转换。关系数据库为主、三元组库为从。这两个环境应保持一致。这将使数据作为关联开放数据提供给外部应用程序以供使用。

4. ILS便于使用BIBFRAME编辑器,以在BIBFRAME中创建和编辑数据。供应商提供API层以将RDF数据转换并下载到关系数据库中(以传统格式)。在这种情况下,数据变为面向实体,并且它们被转换为传统格式,以允许使用传统数据的其他服务(用于流通等)。在这种情况下,主/从关系由“编辑器”确定(它可以有一个存储系统)。这将使数据作为关联开放数据提供给外部应用程序以供使用。

5. ILS有自己的BIBFRAME接口(在图中称为GUI),因此编目不再是面向记录的,而是面向实体的。系统在两个环境中同时管理两个不同的数据库(关系和三元组库)和每个编目操作(发出 – 编辑 – 删除 – 获取)更新。在这种情况下,主是三元组库,从是关系数据库。

6. 系统允许原始编目在RDF/BIBFRAME环境中进行。编目过程完全是面向实体的(关联开放数据环境);供应商提供API/Web服务以将系统与传统系统连接(转换和管理来自传统系统的数据)。没有必要拥有平行的传统环境,但图书馆希望与现有的传统环境保持联系。

7. 系统允许原始编目在RDF/BIBFRAME环境中进行。编目过程完全是面向实体的(关联开放数据环境),整个ILS很可能在RDF中生成和管理数据[或者情况可能并非如此,但这种情况不属于本文档的范围] 。没有理由拥有并行环境,因为完全实现了向新的关联开放数据环境的过渡。

8. 供应商将确保前面提到的工具/技术将考虑BIBFRAME的演变;特定组件将更新吸收BIBFRAME模型和词汇表中的更改,通过… [定义特定时间,例如从新BIBFRAME版本发布后一年]。

9. 供应商将提供一个发现工具,该工具能够为BIBFRAME提出的实体关系模型提供证据。面向OPAC/面向BIBFRAME的发现系统的详细信息需要本文档的另一部分(或其他特定文档)。就OPAC/发现工具而言,此列表并未全面展示前端系统的可能演变。如果没有以前的级别,则该级别不被视为更高级别的合规性,而是较低级别的合规性。

10. 供应商必须确保共享所有项目文件(技术和实践),以便将来在供应商的专属领域之外管理系统。

大学未来、图书馆未来:美国大学图书馆服务分析

看着国内大学图书馆阅读推广热火朝天日甚一日以至于到一枝独秀的地步,不免疑惑:大学图书馆的作用到底是什么?它的主要工作难道不是为教学科研服务?尤其是研究型大学,为科研服务不应该是重中之重?在高等教育本身面临转折的大环境下,图书馆究竟应该把工作重点放在哪里,才能在去中介的网络环境中,维持其在高等教育体系中的地位?

2018年10月OCLC发布研究报告《大学未来、图书馆未来:图书馆战略与机构方向的结合》:
Malpas, Constance, Roger Schonfeld, Rona Stein, Lorcan Dempsey, and Deanna Marcum. University Futures, Library Futures: Aligning Library Strategies with Institutional Directions. Dublin, OH: OCLC Research, 2018. https://doi.org/10.25333/WS5K-DD86. ISBN: 978-1-55653-076-0
本报告得到Andrew W. Mellon基金会部分资助,由OCLC研究部和Ithaka S+R成员撰写,通过调查分析美国不同类型大学的图书馆在提供服务方面的差异。报告很长,我只关注美国高校图书馆(尤其是研究性大学)的情况,具体来说,就是:第4章“图书馆服务框架”,第5章一部分“调查发现:图书馆在关键服务领域的投资”。

报告开发了一个图书馆服务框架,把高校图书馆提供的服务分成如下9个关键领域(第4章):
1 聚集校园社区:为社区广泛或特定的子群体提供空间和设施项目,以促进参与、推广和包容。
2 实现学业成功:支持教学、促进学习、提高信息素养和/或最大限度地保留、升级、毕业和以后的生活成功。
3 促进信息获取:能够发现和使用任何格式或所有权的信息资源;提供一般馆藏的长期保存。
4 培养学术和创造:提供支持研究和创造性工作的专业知识、帮助、工具和服务。
5 包容和支持校园外用户:为非全日制学生、远程和在线学习者以及其他主要校园外/非校园/远程用户提供公平访问。
6 长期保存和促进独特馆藏:确保稀有资料和特藏的长期管理,并最大限度地利用它们。
7 提供学习空间:为学术合作、安静学习以及技术增强教学和/或学习提供物理空间。
8 展示学术专长:促进学者和员工的卓越研究和主题专业知识;包括开放存取预印资料的存储库活动。
9 转变学术出版:推动现代化格式、改进商业模式、降低市场集中度。

第5章按当前实际、当前理想和未来5年,分别提供不同类型图书馆在上述9个领域的投资配额(图表)。本人特别关注研究图书馆协会(ARL)成员馆。由于数据集还没有发布,以下数据大多根据图示估计:
当前资源配额(仅列10%左右及以上)
p.68 所有馆:促进信息获取<23.5%,实现学业成功 22%,提供学习空间 16%,培养学术和创造10.5%,包容和支持校园外用户<9.5%
p.69 ARL:促进信息获取 23%,实现学业成功 18%,提供学习空间 14.6%,长期保存和促进独特馆藏 12%,培养学习和创造 11%【特别重视:长期保存和促进特藏,所有馆 8%】

当前理想(应当优化;仅列10%左右及以上)
p.71 所有馆:实现学业成功 22%, 促进信息获取 19.7%, 提供学习空间 15%,培养学术和创造 10.5%,包容和支持校园外用户<9.5%
p.72 ARL:实现学业成功 20%,促进信息获取 19.5%,培养学术和创造 14.5%,长期保存和促进独特馆藏 14%,提供学习空间 11.5 %【从14.6明显下降】

未来5年资源配置(仅列10%左右及以上) p.73 所有馆:实现学业成功 20.5%,促进信息获取 19.5%,提供学习空间 13%,培养学术和创造 10.5%,包容和支持校园外用户 10% p.74 ARL:促进信息获取 19.5%,实现学业成功 15%,培养学术和创造 14%,长期保存和促进独特馆藏 13.5%,提供学习空间 12.5%

几个注意点(数据请看报告原文):
(1)“3促进信息获取”配额下降明显(23.5%->19.5%),以至低于“2实现学业成功”。是因为用户在信息获取上对图书馆依赖下降?
(2)“2实现学业成功”排名由第二升至第一,但配额不增反降(22%->20.5%)。奇怪的是ARL成员馆认为理想状态是增加“2实现学业成功”投入,但未来5年配额反而减少(18%->20%->15%)。
(3)“7提供学习空间”排名保持第三,但配额呈下降趋势(16%->13%);ARL成员馆此排名更降至第五。是对近年强调“空间服务”的一种反思,还是已经完成了对空间的投资?
(4)减少的投入到了哪里?所有馆主要在“8展示学术专长”(3.5%->5%);ARL成员馆在此方面原就较高,且希望增加(5.5%->6.5%->6.5%)。机构库、学者库……仍是投入方向。
(5)ARL成员馆希望投入增加最多的是“9转变学术出版”(4.5%->7%->6%),仍然保持配额是所有馆的2倍(2%->3.5%->3%)。
(6)ARL成员馆特别重视“6长期保存和促进独特馆藏”,且呈提高趋势(12%->14%-13.5%);所有馆基本上维持在8%,差距明显。
(7)“4培养学术和创造”在所有馆排名稳定在第四、投入10%左右。但在ARL成员馆,此排名由第五升至第三(11%->14%),在“2实现学业成功”上减少的投入,加到了这里——对一般教学的支持,逐渐转向对研究与创新的支持?
(8)“5包容和支持校园外用户”在所有馆排名稳定在第五、投入10%左右。在ARL成员馆虽然期望配额有较大上升(4.5%->6.5%),但相对不受重视,原因何在?

报告指出的总体结论是:“重点从馆藏管理转向以参与为导向的服务。”是不是这么绝对?在馆藏趋同的大背景下,或许特藏是例外。
【我的结论】其实投入排名不是那么容易改变的,比如“3 促进信息获取”上的投入再减恐怕也不会超过“9 转变学术出版”。关注ARL成员馆与所有馆的差异,才是研究型大学图书馆可以参照的发展方向吧?