OCLC发布报告:用Wikibase创建图书馆关联数据

在MARC时代,由于工作界面和读者界面分离,编目员习惯了只求耕耘、不问收获,大多埋头填写MARC字段,很少甚至从来不用OPAC,既不关心编目结果如何呈现给读者(并非所有字段、子字段都会在OPAC上显示),也不了解读者有哪些途径查找目录(很多图书馆自动化系统,工作人员内部与外部OPAC的检索途径不尽一致)。当大环境发生改变,编目的作用一再被忽视后,其结果是编目员自己也不免对编目产生怀疑。

OCLC的“通道项目”(Project Passage)基于Wikidata所用的Wikibase,在关联数据环境下进行描述图书馆和档案馆资源的试验,达到无需了解关联数据的技术机制,也无需离开元数据创建工作流程,通过项目团队开发的工具:1) 发现界面Explorer,即能查看他们的工作成果;2) 检索器Retriever可将外部数据引入Wikibase实例,作为新资源描述的基础。这两个工具简化了描述任务,又可使人们看到正在进行的工作的效果,不仅有助于编目员理解关联数据的作用,也可激发编目员的工作热情。用项目介绍博文的说法是,“使他们能够在当前和新的实践标准之间进行直接比较,同时保留最重要的图书馆员的价值观。”

项目实施于2017-2018年,之前OCLC并没有提到项目名称。参见博文:OCLC关联数据Wikibase原型系统项目(附:图书馆关联数据:从幻灭到生产)(2018-11-24)。文中对Wikibase作了介绍。

项目主页:Linked Data Wikibase Prototype
其中提到项目在三个主要领域实现了目标:
1. 协作:OCLC员工团队和来自16个机构的数十名图书馆员在关联数据生态系统中创建了用例,创建了实体并进行了编辑,使用OCLC社区中心讨论工作流程和提出问题,并参加了28个月的会议和每周的“办公时间”会议。
2. 调和服务:使用SPARQL端点和一个名为“Explorer”的用户界面,尝试对实体协调/协调的编目工作流程。
3. 编辑:在原生Wikibase用户界面中管理实体,Explorer,以及另一个实验性应用程序“The Retriever检索器”。
在项目开始时描述的简单原型已经逐渐成熟,可以使用一组强大的第三方工具和本地应用程序来管理超过100万个Wikidata实体。由项目参与者的新想法、要求的功能以及对应用程序和原型使用指南的反馈,推动了该项目向更全面的工具和应用程序集的演进。

项目结束将近一年,OCLC发布了报告《用Wikibase创建图书馆关联数据》,由部分参与项目的合作图书馆成员及OCLC人员共同完成:

Creating Library Linked Data with Wikibase: Lessons Learned from Project Passage / By Jean Godby, Karen Smith-Yoshimura, Bruce Washburn, Kalan Knudson Davis, Karen Detling, Christine Fernsebner Eslao, Steven Folsom, Xiaoli Li, Marc McGee, Karen Miller, Honor Moody, Craig Thomas, and Holly Tomren. 2019-8

在报告发布前,报告作者之一Karen Smith-Yoshimura在研究部博客Hanging Together上发表了2篇介绍博文:
Summarizing Project Passage experiences in creating library linked data in Wikibase (1 of 2) (July 11, 2019)
Summarizing Project Passage experiences in creating library linked data in Wikibase (2 of 2) (July 17, 2019)
[update 2019-10-15] 内容参见:用Wikibase创建图书馆关联数据:通道项目的经验(2019-10-15)

图书馆在编目领域采用关联数据应该是一个确定的方向,不清楚的是如何采用。各家都在探索,既包括标准,也包括工具。OCLC作为业界大腕,也是最早且持续的探索者。不知此项目对OCLC的工作会有怎样的实际影响。参见:

ALA 2019仲冬会议的BIBFRAME更新论坛

德国国家图书馆的Reinhold Heuvelmann在BIBFRAME邮件组发消息,看到BIBFRAME更新论坛的所有报告都上线了(官方未发信息)。

2011年书目框架行动启动以来,自2012年冬起更新论坛每年2次在ALA仲冬和夏季年会中举办。参见:
LC书目框架转换行动:首届更新论坛(2012-2-7)
ALA 2016仲冬会议的BIBFRAME更新论坛(2016-1-29)
2016 ALA年会BIBFRAME更新论坛(2016-8-27)
2017年BIBFRAME更新论坛(2017-7-26)
2018年BIBFRAME更新论坛(2018-11-14)

今年照例除美国国会图书馆(LC)本身外,还请了其他机构,除从不缺席的OCLC,特别是欧洲的出席,共4家5个报告。
BIBFRAME Update Forum at ALA Midwinter Meeting 2019 (2019-1-27)

一、LC的BIBFRAME试验扩展
1、Expanding the Pilot / Sally McCallum, Library of Congress (PPT, 76KB)
【完成了从MARC到BIBFRAME转换,开始反向转换。】
转换的动机。
转换中遇到的问题,包括:BIBFRAME作品到MARC题名规范或者书目作品?非拉丁文字880字段;来自BIBFRAME数据的URI(带入MARC);MARC子字段末尾标点(不再有)。

2、Anonymous Resources, Blank Nodes, And Providers, Oh My! / Kevin Ford, Library of Congress (PPT, 392KB)
【本次会议最有意思的报告:BIBFRAME转换的匿名资源或空节点问题,实验通过规范控制或实体URI减少空节点】
使用匿名资源会导致大量重复资源,匿名资源的数量正在导致或将导致性能和扩展问题。
以“提供者”(主要是出版者)为例:在1800万MARC书目记录中=约1500万匿名提供者Agent资源。其中许多(大多数?)表达相同实体,比如Harcourt Brace, Penguin Books, Harper Collins。1500万中有120万独特提供者。
因此我们创建了一个“提供者”文档……做实验【即出版社规范档:id.loc.gov/bfentities/providers/…,实验对出版社使用URI】

二、LD4P2
3、LD4P Status update / Philip Schreur, Stanford University (PPT, 868KB)
介绍使用Sinopia作为BIBFRAME编辑器,使用SHARE-VDE转换记录为BIBFRAME(2018年BIBFRAME更新论坛上有SHARE-VDE介绍),以及LD4P的成果。
参见:
BIBFRMAE应用进展:LD4P实施之路(2018-7-8)
LD4P2走向实施之路:目标与工作(附LD4系列)(2019-1-8)

三、欧洲BIBFRAME研讨会
4、European BIBFRAME Workshop / Reinhold Heuvelmann, German National Library (PPT, 3.23MB)
欧洲BIBFRAME研讨会已经召开两届,每年9月召开:
2017.9.26-27 European BIBFRAME Workshop 2017, German National Library, Frankfurt https://wiki.dnb.de/display/EBW
2018.9.17-19 European BIBFRAME Workshop 2018, European University Institute, Fiesole (Florence), Italy http://www.casalini.it/EBW2018
2019.9.17-18 European BIBFRAME Workshop 2019, National Library of Sweden, Stockholm,

四、OCLC
5、OCLC BIBFRAME Update / Nathan Putnam, OCLC (PPT, 13.61MB)
介绍OCLC研究部的BIBFRAME相关工作:
* 使用LC的转换器,将WorldCat中的MARC记录转换为BIBFRAME数据,得到的经验教训是:[1]作品ID很重要,在处理开始就有用;[2]URI很重要,空节点=不可互操作;[3]OCLC处理书目记录=很少单件/实例数据【?】。
* OCLC研究部当前活动:创建可用的BIBFRAME数据图,供最终用户测试,已经完成:[1]Hash URI代替空节点;[2]移除已经有VIAF或FAST的额外实体属性【指哪些?】;[3]评审BIBFRAME管理数据【BF管理元数据放在作品下有点奇怪】;[4]在WorldCat记录集上测试图修改。
* 现在:OCLC研究部与全球产品管理部共享信息,前进的道路取决于回答有关问题:[1]工作流程,[2]用例,[3]期望成果/服务。
* 向前走,我们知道我们将提供BIBFRAME数据,需要答案的问题集中在社区需要和期望的内容上:[1]重要的是什么(标识符来源,转换选项,质量等);[2]如何评估数据?(API、下载、导出等)[3]应当强化什么?[4]WorldCat中的编目工作流程是什么?
* 与成员馆合作:
与RLP成员合作:[1]焦点小组,[2]收集需求,[3]期望的工作流程,[4]实践工作流程开发。
与成员馆和小组合作,如PCC、OCLC元数据首创咨询组、MOUG(音乐OCLC用户组 )、OLAC(关注非印刷资料的编目员组织)、OCLC CJK用户组等。

大学未来、图书馆未来:美国大学图书馆服务分析

看着国内大学图书馆阅读推广热火朝天日甚一日以至于到一枝独秀的地步,不免疑惑:大学图书馆的作用到底是什么?它的主要工作难道不是为教学科研服务?尤其是研究型大学,为科研服务不应该是重中之重?在高等教育本身面临转折的大环境下,图书馆究竟应该把工作重点放在哪里,才能在去中介的网络环境中,维持其在高等教育体系中的地位?

2018年10月OCLC发布研究报告《大学未来、图书馆未来:图书馆战略与机构方向的结合》:
Malpas, Constance, Roger Schonfeld, Rona Stein, Lorcan Dempsey, and Deanna Marcum. University Futures, Library Futures: Aligning Library Strategies with Institutional Directions. Dublin, OH: OCLC Research, 2018. https://doi.org/10.25333/WS5K-DD86. ISBN: 978-1-55653-076-0
本报告得到Andrew W. Mellon基金会部分资助,由OCLC研究部和Ithaka S+R成员撰写,通过调查分析美国不同类型大学的图书馆在提供服务方面的差异。报告很长,我只关注美国高校图书馆(尤其是研究性大学)的情况,具体来说,就是:第4章“图书馆服务框架”,第5章一部分“调查发现:图书馆在关键服务领域的投资”。

报告开发了一个图书馆服务框架,把高校图书馆提供的服务分成如下9个关键领域(第4章):
1 聚集校园社区:为社区广泛或特定的子群体提供空间和设施项目,以促进参与、推广和包容。
2 实现学业成功:支持教学、促进学习、提高信息素养和/或最大限度地保留、升级、毕业和以后的生活成功。
3 促进信息获取:能够发现和使用任何格式或所有权的信息资源;提供一般馆藏的长期保存。
4 培养学术和创造:提供支持研究和创造性工作的专业知识、帮助、工具和服务。
5 包容和支持校园外用户:为非全日制学生、远程和在线学习者以及其他主要校园外/非校园/远程用户提供公平访问。
6 长期保存和促进独特馆藏:确保稀有资料和特藏的长期管理,并最大限度地利用它们。
7 提供学习空间:为学术合作、安静学习以及技术增强教学和/或学习提供物理空间。
8 展示学术专长:促进学者和员工的卓越研究和主题专业知识;包括开放存取预印资料的存储库活动。
9 转变学术出版:推动现代化格式、改进商业模式、降低市场集中度。

第5章按当前实际、当前理想和未来5年,分别提供不同类型图书馆在上述9个领域的投资配额(图表)。本人特别关注研究图书馆协会(ARL)成员馆。由于数据集还没有发布,以下数据大多根据图示估计:
当前资源配额(仅列10%左右及以上)
p.68 所有馆:促进信息获取<23.5%,实现学业成功 22%,提供学习空间 16%,培养学术和创造10.5%,包容和支持校园外用户<9.5%
p.69 ARL:促进信息获取 23%,实现学业成功 18%,提供学习空间 14.6%,长期保存和促进独特馆藏 12%,培养学习和创造 11%【特别重视:长期保存和促进特藏,所有馆 8%】

当前理想(应当优化;仅列10%左右及以上)
p.71 所有馆:实现学业成功 22%, 促进信息获取 19.7%, 提供学习空间 15%,培养学术和创造 10.5%,包容和支持校园外用户<9.5%
p.72 ARL:实现学业成功 20%,促进信息获取 19.5%,培养学术和创造 14.5%,长期保存和促进独特馆藏 14%,提供学习空间 11.5 %【从14.6明显下降】

未来5年资源配置(仅列10%左右及以上) p.73 所有馆:实现学业成功 20.5%,促进信息获取 19.5%,提供学习空间 13%,培养学术和创造 10.5%,包容和支持校园外用户 10% p.74 ARL:促进信息获取 19.5%,实现学业成功 15%,培养学术和创造 14%,长期保存和促进独特馆藏 13.5%,提供学习空间 12.5%

几个注意点(数据请看报告原文):
(1)“3促进信息获取”配额下降明显(23.5%->19.5%),以至低于“2实现学业成功”。是因为用户在信息获取上对图书馆依赖下降?
(2)“2实现学业成功”排名由第二升至第一,但配额不增反降(22%->20.5%)。奇怪的是ARL成员馆认为理想状态是增加“2实现学业成功”投入,但未来5年配额反而减少(18%->20%->15%)。
(3)“7提供学习空间”排名保持第三,但配额呈下降趋势(16%->13%);ARL成员馆此排名更降至第五。是对近年强调“空间服务”的一种反思,还是已经完成了对空间的投资?
(4)减少的投入到了哪里?所有馆主要在“8展示学术专长”(3.5%->5%);ARL成员馆在此方面原就较高,且希望增加(5.5%->6.5%->6.5%)。机构库、学者库……仍是投入方向。
(5)ARL成员馆希望投入增加最多的是“9转变学术出版”(4.5%->7%->6%),仍然保持配额是所有馆的2倍(2%->3.5%->3%)。
(6)ARL成员馆特别重视“6长期保存和促进独特馆藏”,且呈提高趋势(12%->14%-13.5%);所有馆基本上维持在8%,差距明显。
(7)“4培养学术和创造”在所有馆排名稳定在第四、投入10%左右。但在ARL成员馆,此排名由第五升至第三(11%->14%),在“2实现学业成功”上减少的投入,加到了这里——对一般教学的支持,逐渐转向对研究与创新的支持?
(8)“5包容和支持校园外用户”在所有馆排名稳定在第五、投入10%左右。在ARL成员馆虽然期望配额有较大上升(4.5%->6.5%),但相对不受重视,原因何在?

报告指出的总体结论是:“重点从馆藏管理转向以参与为导向的服务。”是不是这么绝对?在馆藏趋同的大背景下,或许特藏是例外。
【我的结论】其实投入排名不是那么容易改变的,比如“3 促进信息获取”上的投入再减恐怕也不会超过“9 转变学术出版”。关注ARL成员馆与所有馆的差异,才是研究型大学图书馆可以参照的发展方向吧?