上海图书馆Folio实施计划(附Folio进展2020)

2020年世界开放图书馆基金会议(WOLFcon 2020)1月22-24日在美国德克萨斯举行体会,上海图书馆刘炜馆长在会上介绍了中国及上图Folio进展。报告及相关视频见:WOLFcon2020相关视频及资料(在:中国 SIG Home

3月10日FOLIO中国社区第十次例会在网上举行,参加WOLFcon的多家机构分享参会收获,聚焦Folio,包括:上海凯勤、深圳科图、苏州嘉图、上海阿法迪和上图。另外,EBSCO的Vincent Lee(李宗晔)介绍Folio进展(Folio Update,摘要附后)。会议报告下载:20200310会议PPT

关于Folio,参见:开发中的图书馆服务平台Folio概览(2019-1-4)

多个报告内容技术性较强,做技术的应该会有收获。不懂技术如我,更关注Folio的应用进展。

上图张磊主任的最后一个报告,标题是“WOLFcon总结”,实际内容可视为上图Folio的FAQ,信息相当丰富:

  • 上图Folio团队的目标
  • 上图Folio平台与中国Folio平台的关系
  • 上图Folio平台与国际Folio平台的关系
  • 上图Folio平台
  • 上图Folio平台与上海市中心图书馆联盟

综合张主任报告,上图将在2020年上半年完成“上图Folio平台”的开发和实施,下半年各基础模块陆续开始测试并试运行,争取年底发布上图Folio平台。

“上图Folio平台”非开源项目,仅服务于上图和中心馆一卡通,计划涵盖上图、各区馆、街道馆、基层服务点4级流通,以及发现、典藏、积分、活动、采访、编目等多方面业务。

计划分阶段实施,先解决流通问题(典藏、流通、发现),以后逐渐实施采访(编目)等模块(可称第2阶段)。集成各种应用系统的“第三代图书馆服务平台”则是第3阶段的任务了。

与国际Folio社区对照看,国际上更多关注电子资源管理、不少机构首先采用的模块是ERM,而上图目前主要关注传统采编流、更以流通为第一优先,可以说是以取代现有ILS为目标(上图现在的ILS系统基本也是做流通,采编的日常工作并不在ILS中完成)。

另外,国际Folio社区的用户以高校图书馆为主,没有上图这么高的流通量、这么多的服务点,这也是上图Folio平台极为关注的重点。本次例会上科图苏勇先生关于“FOLIO负载均衡与SIP2研发情况汇报”就是非常有针对性的研究。

上图Folio团队的另一个目标是维护一套符合国内公共图书馆需求的、免费开源的“中国Folio平台”,具备采、编、流等基础通用模块。

—— Folio进展(摘要) ——

  • 首家使用机构Chalmers理工大学:全球大学质量排名125位,小馆(1.6万FTE,70册远程存储纸质馆藏),主要使用电子资源;原使用Innovative的Sierra和ProQuest的Summon。花6个月准备, 2019-9-30上线模块:借、还、用户、预约、典藏、订购、源记录存储(典藏的小子集),纸质资源为主。【参见:首家Folio图书馆服务平台上线(2019-11-2)】
  • Perpetua:数字资源(如特藏和档案)安全获取、长期保存的托管解决方案,首个集成至folio的第三方app
  • Folio的独特架构:Edge API

实施计划

  • 第1轮附加(ERM电子资源管理)/2020年1月:康奈尔大学、密苏里州立大学、ZBW(莱布尼茨经济信息中心,基尔/汉堡)
  • 第2轮早期采用者/2020年中:Simmons大学、Warner大学、密苏里州立大学、莱比锡大学(ERM和采访)、不来梅州立大学(ERM)【功能改进:导入、MARC编辑、导出】
  • 第3轮早期采用者/2020年末到2021年初:Wentworth理工大学,Lehigh大学,阿拉巴马大学,GBV德国北部图书馆服务(除流通外全部)
  • 第4轮早期采用者/2021年中:芝加哥大学,杜克大学,5所学院,德克萨斯农工大学、康奈尔大学

Folio里程碑/版本(2019第3季-2020第4季)【较早:Clover四叶草】

  • 2019 Q3 Daisy雏菊
  • 2019 Q4 Edelweiss雪绒花【2020-1-10已发布】
  • 2020 Q1 Fameflower红花【计划2020-4-10发布】
  • 2020 Q2 Goldenrod金毛
  • 2020 Q3 Honeysuckle金银花
  • 2020 Q4 Iris鸢尾花

Innovative公司被艾利贝斯公司收购

早上收到Innovative公司(即III)CEO邮件,主题是Innovative signs agreement to be acquired by Ex Libris,首先是感到震惊。继而想到Proquest/Ex Libris一统江湖顺风顺水,再下一城也没什么好奇怪的。随着Innovative被并购,如今自行开发图书馆自动化系统的大公司只剩SirsiDynix了。

III和Ex Libris及其母公司ProQuest网站上都发布了相同的新闻稿:

Ex Libris Signs Definitive Agreement to Acquire Innovative (December 5, 2019)

并购将于2020年初完成。新闻稿最后有III公司博客上的FAQ链接:Top Questions About Ex Libris Agreement to Acquire Innovative (December 5, 2019)

FAQ包括:收购理念,客户(对III客户和Ex Libris客户),组织与管理,业务连续性。从中获取信息:

1、III将成为Ex Libris的一个业务部门(Business unit),暂时原有业务照旧。

2、FAQ中多处提到云服务、基于云的解决方案,这应该是III的重大缺憾。

3、Alma仍是Ex Libris主推系统。

想起去年III来宣讲产品,我问为什么系统的用户手册不能在网上公开访问。实际上因为要密码登录,很多同事都没有看过Millennium系统的联机手册。
销售主管很奇怪地问我:不是用户,为什么要了解产品?
我说,让大家都了解有什么功能、如何使用,也是一种宣传啊。别的公司就是这么做的。
他质疑:什么公司?
我很奇怪他竟然会不知道有这样的公司存在,而且就是他们的竞争对手。在这种场合我不想明言,只好笑着说:不就是那家公司嘛。
希望Innovative被那家公司收购后,企业文化也能为之一变。 

对《对ILS投标者的BIBFRAME期望》的意见

2018-8-22 德国国家图书馆 Lars Svensson 在BIBFRAME邮件组中,针对2018年2月《对ILS投标者的BIBFRAME期望》提出意见,认为应当提出“功能需求”而不是“技术要求”,并参考2013年BIBFRAME用例与需求,从不同方面举例。

原文件参见:2017 EBW:对ILS投标者的BIBFRAME期望(2019-4-3)

—— 对《对ILS投标者的BIBFRAME期望》的意见 ——
[BIBFRAME] Some comments on “BIBFRAME Expectations for ILS Tenders” / Lars Svensson (2018-8-22)

……我认为该文所采取的总体方向存在一些问题。我觉得它主要关注技术而功能要求太少。本文建议过渡,从范式(1)其中编目在MARC记录中直接完成,并且图书馆集成库系统(ILS)使用关系数据库(RDBM)存储编目和任何相关联的数据存储到另一范式(2)其中编目在RDF中完成(使用BIBFRAME数据模型),ILS使用三元组库来存储必要的信息。我想说的是,第一个假设未必是真实的(有相当长的一段ILS其中数据不使用RDBM存储,至少一些图书馆编目不通过创建或编辑MARC记录,但使用其他元数据格式,如果需要可以转换为MARC)。我还要说,对新系统范式的建议过于狭隘,甚至可能通过强制要求使用哪种技术来阻碍创新。例如,有一种称为图数据库的新兴技术,它允许以有趣的方式分析图中的数据,包括找到两个节点之间的最短路径,找到“孤岛”(图或子树未连接到图的任何其他部分)或松散连接的子树(例如仅由一条边连接的子树)。如果我们要求使用三元组库,则供应商将无法使用此技术,因此将失去实现有趣统计功能的可能性。在我看来,招标应该尽可能技术中立(至少在系统内部方面)。

那么招标要包含什么呢?
我的看法是它应该指定所需的功能。毕竟,有趣的是我们希望系统做什么(或者至少我们想要对系统做什么)。对于基于关联数据的系统,我能想到的非详尽列表将是【引用2013 BIBFRAME使用案例与需求,参见:BIBFRAME使用案例与需求(2014-10-26)】

– 系统必须能够以下列格式导入图书馆数据:
— MARC 21(多半有不同风味)【比如:德国的没有ISBD标识符?LC较少用连接字段?】
— 使用BIBFRAME数据模型的RDF
— 使用RDA数据模型的RDF
— …
– 系统必须能够以下列格式导出数据:
— MARC 21(多半有不同风味)
— 使用BIBFRAME数据模型的RDF
— DC-XML(用于OAI-PMH)
— …
– 系统必须支持下列导入和导出接口:
— SRU/SRW
— OAI-PMH(双向同步)
— Z39.50 😉
— W3C WebSub(确保系统是Web的)
— …
– 编目模块必须允许编目员:
— 将题名和规范连接到驻留在本地系统中的其他题名和规范(例如,连接出版物与其继承者或作者;连接作者与其出生地、出生地与其所属国家)
— 将题名和规范连接到驻留在联机数据库中的其他题名和规范(可能要求系统必须支持的搜索界面列表)
— …
– 系统必须允许管理者:
— 配置数据录入表单,如限制编目员可以使用哪个规范档
— 以标准化格式导入和导出数据录入配置和元数据纲要(可能说明此种格式清单,如SHACL, ShEx, JSON Schema, XML Schema……)
— 无缝包含第三方数据库(IEEE Xplore, EconBiz, PubMed, ………)到最终用户检索中
– 系统必须允许最终用户:
— 使用单一、统一搜索界面搜索图书馆内部内容和第三方数据库
— 导出书目引文到第三方引文管理系统
— 对匹配定制搜索的新内容订阅RSS/Atom源【推送】
— …
对我,此方法的优点是:
1) 客户需要考虑他们真正希望系统做什么
2) 供应商可以专注于以舒适的方式实现此功能,而不必专注于新技术。

Karen Coyle与Lars进行了一番互动,认为在关联数据的讨论中缺少内容:要做哪些链接?由此Lars对需求作了补充:
这让我想到了另一个重要的要求,我通常认为这是理所当然的,但这可能需要明确:
系统必须为系统中管理的所有实体公开可解引的URI。管理员还必须有一种方法可以为所有或某些类型的实体(例如,不得共享的资源)禁用此功能