2017 EBW:对ILS投标者的BIBFRAME期望

关于欧洲BIBFRAME研讨会(EBW),参见:
欧洲BIBFRAME研讨会(2019-3-29)
2018 EBW:就RDA与BIBFRAME致信RDA指导委员会(2019-4-2)
[update,对本文件的反馈: 对《对ILS投标者的BIBFRAME期望》的意见(2019-4-3)]

2017年欧洲BIBFRAME研讨会上讨论了对集成图书馆系统(ILS)实现关联数据模型的要求,尤其是应用BIBFRAME。由此2018年EBW组委会要求Tiziana Possemato(意大利数据/系统厂商 Casalini Libri – @cult)草拟规范《对ILS投标者的BIBFRAME期望》,作为2017 EBW成果。文件提出了ILS转向BIBFRAME/关联数据的不同级别,可作为招标需求。其中ILS主要指其编目模块,共定义了3个类型、逐步过渡到关联数据环境的10个级别。以下摘译“ILS的BIBFRAME一致性级别”部分。
注:其中提到主/从(技术):“一种通信模型,其中一个设备或进程对一个或多个其他设备具有单向控制。 在某些系统中,从一组符合条件的设备中选择一个主设备,其他设备扮演从设备的角色”

EBW-ILS

—— 对ILS投标者的BIBFRAME期望(摘录) ——
BIBFRAME Expectations for ILS Tenders (2018-02)
ILS的BIBFRAME一致性级别

以下一致性级别可分为三种不同类型:
a. 元数据生成/维护:1-8级
b. 发现:9级
c. 文档化/未来能力:10级
当图书馆提供更加成熟和明确的要求时,将来可以改进这些类型组中的每一个。

1. 第一级(入门级):ILS需要管理格式并能够生成“做得好”的数据(这意味着高质量的MARC数据),准备转换为BIBFRAME。该系统仍然处于传统环境中,但供应商已经改进了编目标准或格式,使传统MARC记录更易于转换。这些功能的一些示例是:
 管理对数据转换为BIBFRAME有用的属性和关系的可能性;
 使用RDA条款和指南进行编目的可能性;
 使用URI管理和丰富MARC记录的可能性;
 管理ILS级别的书目和规范记录之间的链接、使转换变得更加容易的可能性,因为系统确保了链接的一致性。
通常,任何提高数据质量的功能都有助于以后的转换。在这种情况下,编目模块完全面向记录

2. 供应商可以提供转换工具,能够转换为各种模型,包括BIBFRAME(从MARC/MODS …格式到关联数据),不包含在ILS中,但可用于转换数据。在这种情况下,编目模块完全面向记录,之后实现到BIBFRAME的转换。关系数据库为主、三元组库为从。

3. 供应商可以提供连接到ILS的BIBFRAME转换器:这意味着一次性实现海量数据转换,但系统应允许逐个记录RDF(BIBFRAME)数据集的更新。此外,系统应允许更新已经采用RDF格式的数据。在这种情况下,编目模块仍然完全面向记录,之后实现了对BIBFRAME的转换。关系数据库为主、三元组库为从。这两个环境应保持一致。这将使数据作为关联开放数据提供给外部应用程序以供使用。

4. ILS便于使用BIBFRAME编辑器,以在BIBFRAME中创建和编辑数据。供应商提供API层以将RDF数据转换并下载到关系数据库中(以传统格式)。在这种情况下,数据变为面向实体,并且它们被转换为传统格式,以允许使用传统数据的其他服务(用于流通等)。在这种情况下,主/从关系由“编辑器”确定(它可以有一个存储系统)。这将使数据作为关联开放数据提供给外部应用程序以供使用。

5. ILS有自己的BIBFRAME接口(在图中称为GUI),因此编目不再是面向记录的,而是面向实体的。系统在两个环境中同时管理两个不同的数据库(关系和三元组库)和每个编目操作(发出 – 编辑 – 删除 – 获取)更新。在这种情况下,主是三元组库,从是关系数据库。

6. 系统允许原始编目在RDF/BIBFRAME环境中进行。编目过程完全是面向实体的(关联开放数据环境);供应商提供API/Web服务以将系统与传统系统连接(转换和管理来自传统系统的数据)。没有必要拥有平行的传统环境,但图书馆希望与现有的传统环境保持联系。

7. 系统允许原始编目在RDF/BIBFRAME环境中进行。编目过程完全是面向实体的(关联开放数据环境),整个ILS很可能在RDF中生成和管理数据[或者情况可能并非如此,但这种情况不属于本文档的范围] 。没有理由拥有并行环境,因为完全实现了向新的关联开放数据环境的过渡。

8. 供应商将确保前面提到的工具/技术将考虑BIBFRAME的演变;特定组件将更新吸收BIBFRAME模型和词汇表中的更改,通过… [定义特定时间,例如从新BIBFRAME版本发布后一年]。

9. 供应商将提供一个发现工具,该工具能够为BIBFRAME提出的实体关系模型提供证据。面向OPAC/面向BIBFRAME的发现系统的详细信息需要本文档的另一部分(或其他特定文档)。就OPAC/发现工具而言,此列表并未全面展示前端系统的可能演变。如果没有以前的级别,则该级别不被视为更高级别的合规性,而是较低级别的合规性。

10. 供应商必须确保共享所有项目文件(技术和实践),以便将来在供应商的专属领域之外管理系统。

开发中的图书馆服务平台Folio概览

2018年最后2天,应Keven之邀参加Folio系统界面翻译,跨年和元旦都在刷汉译——仅凭对图书馆自动化系统的了解,对Folio本身则几无所知。人多力量大,demo汉译在元旦那天基本完成。接下来还将参与Codex兴趣小组的活动,于是先来补下课。

一、关于Folio
Folio = Future of Libraries is Open,开源的图书馆服务平台,前身是开发多年的Kuali OLE (Open Library Environment)。2016年前后,Kuali基金会决定转向商业,于是OLE改与EBSCO和Index Data(丹麦)合作,启动Folio。由2016年项目启动时EBSCO中文网站的长篇介绍,可对Folio有更多了解:
隆重介绍 FOLIO – 一项崭新的合作项目,携手图书馆、服务供应商以及开发人员来促进、创新并且重塑图书馆自动化系统的未来 [2016-6-25]

二、平台状况和路线图(Platform & Roadmap)
Folio官网目前发布的路线图如下,不知是否能如期实现:
第1阶段:发布Alpha版,2018年1月
第2阶段:平台发布(Beta版),2019年初
第3阶段:在图书馆运行,期望2019年初至少有3家图书馆实施
第4阶段:早期实施者,11家图书馆计划在2019年实施

三、Folio平台FOLIO Platform
Folio的特点是模块化、灵活性、扩展性。
任何人可以开发Folio App。现在有十几个设想,比如App设想第3号预约房间、第6号与图书馆活动和网站集成、第8号与机构库集成、第13号支持联合目录。

四、资源管理数据域Resource Management Data Domains
对图书馆实体与电子资源的管理模型,包括以下6个域(图示是简化版):

Resource Management Data Domains

Folio法典域(Folio Codex Domain),由一组最小但足够的核心元数据集组成,更全面的元数据集在动态检索时调用。
知识库域(Knowledge base (KB) Domain):电子资源、印刷资源及其他资源等多种知识库(托管系统中,对实体资源,感觉像是类似联合目录的中心书目库)
馆藏域(Holdings Domain):电子资源的权益/馆藏(Entitlement/Holding),可能与知识库中包(Package)的收录范围等不一致。
采访域(Acquisition Domain):图示中只对电子资源作了标示(省略了实体资源),主要为说明电子资源采访产生的馆藏,可能与知识库中包的收录范围等不一致。
库存域(Inventory Domain):法典域对应的实体资源部分
流通域(Circulation Domain):包括用户借阅实体资源与使用电子资源
Folio的关键假定
1、合并电子和印刷;
2、合并单行和连续出版物;
3、库存和知识库(见上);
4、本地与远程。本模型的主要目标是避免元数据的本地复制。只要有可能,就应该对权威记录进行引用(即链接)。本地系统应仅保留与该单件相关的最小核心元数据集。每当需要完整、丰富的元数据集时,应从权威源(例如知识库)动态检索这些元数据。 此外,本地保留的核心元数据应仅在需要时存在于本地Folio系统中。对于电子单件,这意味着只有在访问单件时才会出现本地占位符。 换句话说,它是将权益(潜在馆藏)转换为实际馆藏的访问权,然后可以在本地Folio系统中表示。
我的理解,法典域是面向读者的检索结果一览信息,详细页面信息由动态调用获取。联想一下——不需要每个馆都维护更新数据,只需要大家共同维护、系统来做更新,是不是很美好?

五、法典元数据模型Codex Metadata Modal
Codex Metadata Modal
Codex是一个规范化和虚拟化层,允许Folio集成有关各种资源的元数据,无论其格式、编码或存储位置。
目前仅包含棕色的5个对象:实例、单件/馆藏、收录范围、位置、包;未来还会增加,确定将增加的是蓝色的2个:作品、主题。目前看各对象包含的字段并不多,应该就是前述法典域所称的元数据核心集。
本模型受BIBFRAME2启发(作品-实例-单件),但并不严格遵循BIBFRAME2(BIBFRAME 2 模型只针对单个资源,没有“包”的概念)。
另关于MARC,MARC记录格式被Folio用作数据交换格式——回归MARC(尤其是UNIMARC)的原始设计。其实现在的图书馆自动化系统、尤其是支持非MARC编目的系统,MARC的作用恐怕也是如此。
我想对Folio来说,这也意味着未来BIBFRAME或其它元数据也可以经crosswalk转换后,纳入到系统中。

战略图书馆技术:当前现实与未来可能

Wiley于3月22日请Marshall Breeding做了一个网络报告,报告时长40多分钟,标题为:战略图书馆技术:当前现实与未来可能。会前需注册,现在视频应该是公开的:
Strategic Library Technologies – Current Realities and Future Possibilities

图书馆自动化系统】内容从图书馆自动化系统开始。有不少来自他的Library Technology Guides 网站数据作成的图表,比如:历年选择或放弃Symphony图书馆数量柱形图,2017年升级到Alma的图书馆之前所用系统饼图,澳大利亚公共图书馆所用系统分布饼图,多个系统的地理分布地图,自动化系统厂商员工数量统计等。
图书馆服务平台】也有他对图书馆自动化系统的总结。相对于原来图书馆集成系统(ILS或LAM)和图书馆服务平台(LSP)二分法,现在增加了介于两者之间的“进步ILS”。LSP只有3个,即OCLC的WorldShare、Alma和尚在开发中的FOLIO。其他如Sierra、SirsiDynix蓝云等都被归在中间这一类——尽管在“产品开发时间线图”中Sierra与其他LSP并列。从他总结的“资源管理模型”看,LSP与ILS/进步ILS的区别主要在于,其技术平台是多租户SaaS、具有知识库(电子馆藏与书目)、只通过API互操作(没有批传输)、采购方式是许可证。之前ILS与电子资源管理(ERM)是分列的,LSP将两者结合在一起。
支持研究与教学】如果说上面是现实,那么未来将超越LSP。报告指出,大学管理者不在意图书馆内部工作流程,LSP之后的技术与服务,要能让图书馆可以支持对大学有战略利益的领域,即研究与课程(教学)。新领域包括:研究数据管理,研究服务支持(展示研究与出版物、资助课题),教学支持(课程阅读列表、降低学生资料费用、版权管理)。(国内目前普遍比较重视研究服务支持即展示这一块(比如学者库),也体现了这一发展趋势)
学术出版转变】图书馆的上游,学术出版社有什么新服务?报告列举了3家企业及其相关工具:
Elsevier:引文库Scopus;索引6900万出版物;分析工具SciVal, PlumX;文献管理Mendeley;研究信息管理系统Pure;机构文章存储库bepress;科学协作网络SSRN
Digital Science:引文库Dimensions;索引8900万出版物;分析工具Altmetric;研究信息管理系统Symplectic;研究数据存储库FigShare
Clarivae:引文库Web of Science(6800万出版物);分析工具InSites;文献管理EndNote;期刊管理系统ScholarOne;同行评议追踪与识别Publons
没想到数字科学公司的引文库竟然数量最多,可谓后来居上。该公司为麦克米伦创立,孵化致力于科学工作流和研究生产力的初创公司如Symplectic、FigShare、Altmetric。