BIBFLOW项目最终报告发布:BIBFLOW路标

2014年初ALA仲冬会议上,加州大学戴维斯分校 Michael Colby 介绍该馆刚得到IMLS资助为期两年的项目“编目再发明:未来图书馆运作模式”(Reinventing Cataloging: Models for the Future of Library Operations)(ALA 2014仲冬会议中的BIBFRAME,2014-2-5)。算一下的话,项目应该在2016年初完成。
当时没有BIBFLOW这个名称。在IMLS网站,无论是“BIBFLOW”还是“Reinventing Cataloging”都查不到。通过校名,查到2013财政年度的这个项目(金额$493,619) :LG-06-13-0201-13
Program: National Leadership Grants for Libraries
The University of California Davis University Library will investigate the future of academic research library technical services by assessing the current landscape and developing a roadmap for strategic planning and investments in the coming years. This roadmap can be continuously updated as new data models, standards, workflows, and practices emerge and evolve. Currently, complex workflows and interdependent systems have constrained academic libraries from fully leveraging the benefits and efficiencies of modern technological infrastructures. This research study will include acquisitions, licensing, cataloging, processing, digitization, and newly identified areas that will encourage using technological resources.

虽然并未提到BIBFRAME,但应该就是BIBFLOW项目了(研究性大学图书馆技术服务的未来)。而其中提到的Roadmap,也终于在2017年3月14日完成,并于日前在项目网站发布,悄悄地。一直关注此项目的 Jeff Edmunds 本月初在 BIBFRAME 邮件组发布了消息。
BIBFLOW: A Roadmap for Library Linked Data Transition (Prepared 14 March, 2017) / MacKenzie Smith, Carl G. Stahmer , Xiaoli Li, Gloria Gonzalez
I. 导论
II. 为什么关联数据
III. 转变基础
IV. 路标概述
V. 阶段一:MARC生态系统中的关联数据 。V.a 步骤一:关联数据查找MARC编目平台 ;V.b 步骤二:MARC 批插入 URI;V.c 步骤三:关联数据导入/导出 API;V.d 阶段一完成
VI. 阶段二:转变到原生关联数据生态系统 。VI.a 步骤一:发起转变到关联数据原生编目 ;VI.b 步骤二:批转换遗留MARC记录;VI.c 步骤三:迭代转换非目录图书馆系统
VII. 转变工作流程 。VII.a 套录 ;VII.b 原编;VII.c 连续出版物编目;VIII. 规范控制
IX. 厂商参与
X. 发现
XI. 当前图书馆关联数据实施调查
附录A:厂商参与态势
附录B:术语词汇

此次发布的报告是网页形式,数十个页面链接,看起来很是不便;其中有不少图示,分辨率更是低到完全看不清。Roy Tennant 自告奋勇转换成了PDF文件,并放在他自己的网站上供下载,但对看不清的图示就无能为力了。其中二阶段各三步骤的转换路标(conversion roadmap)还勉强能够看清:

Figure 6: Transition process overview

摘录报告部分段落:
“本报告的主要发现是,图书馆转变到关联数据,处在比大多数人相信的更好位置。更广的关联数据生态系统和语义网,总体上建立在对实体(人物、地点等)和行动(写作、获取等)的共享唯一标识符的基石上。图书馆具有很长的共享数据治理和标准的历史,因此图书馆文化很适合转变到关联数据,图书馆的结构化数据(MARC)处在很好的数据转换位置。鉴于上述情况,我们的结论是,关联数据代表着机会而非挑战,本路标意在作为希望抓住这一机会的图书馆的指引。”(I. 引言)
“MARC和关联数据编目框架的关键差异是,MARC基于记录,而关联数据基于图谱 (graph)。不同于理论上无限的知识图谱,记录有着固定数量的字段和子字段。……扩展框架的唯一途径是,通过一个复杂的、自上而下的驱动过程,由许多机构与治理团体参与讨论与采用,接着重新编程处理这些记录的所有软件系统。 ”“基于图谱的知识系统则不受制于任何以上局限。它们可强化使用信誉良好的受控词表描述对象的能力,同时提供可扩展性,让用户增加新知识节点(字段)到其描述图谱。”(II. 为什么关联数据)
转变到关联数据并非数据转换活动……转变到关联数据要求增加新数据到每一条记录,数据常会难以由机器消歧。特别是,成功的转变到关联数据生态系统,要求在转换时增加大量共享的公开承认的唯一标识符(URI)到每条记录。基本概念是,在一个图谱中为所有实体提供一个唯一的、机器可操作标识符。”“从数据角度,转变到关联数据的主要障碍,是将MARC记录中实体的文字表达,与机器可操作URI联系起来。这种联系必须反向实施到所有遗留记录(艰巨任务),必须更新图书馆系统,在处理新记录或编辑已有记录时创建这种联系……”(III. 转变基础)