研究数据管理书目(2009-2017)

曾在博文“Data Curation:数据监护?数据保管?”(2011-5-22)中提及此书目,现在这个书目更新到了第9版,含2009-2017年著述:
Research Data Curation Bibliography / Charles W. Bailey, Jr. VERSION 9: 4/18/2018

近年国内 Data Curation 研究热度不减,CNKI收录文章在2016年达到峰值95篇,2017年第2高值73篇。查该术语翻译五花八门,大致有:管护、监管、监护、策管、策展、管理。以我的理解,在图情领域,Data Curation 约等于 Research Data Management (RDM),本书目中有大量文章含后一术语,比data curation更多,因此觉得不妨用“管理”一词更具包容性。

要做研究数据管理,这个书目是不错的参考源。
本书目收录750种精选英文文章、图书和技术报告,含访问链接,在不违反版权的情况下也包括摘要。内容涉及:研究数据创建、采访、元数据、出处、存储库、管理、政策、支持服务、资助机构要求、开放获取、同行评审、出版、引用、共享、重用和保存等主题。
比较可惜的是,书目是按作者字顺排序,没有对论著做简单的分类以方便浏览。也没有嵌入引文数或替代计量数值,辅助评估选择。

关于 data curation,本书目在导言中引用 Christopher A. Lee 和 Helen R. Tibbo 对 digital curation 的定义:
“digital curation涉及创作者和档案工作者的选择和评估,不断提供智力接入,冗余存储,数据转换,并且对于一些材料而言承诺长期保存。digital curation是管理(stewardship),提供认证数字数据和其他数字资产的可重复性和重复使用。开发值得信赖和耐用的数字储存库,声音元数据创建和捕获的原则,使用文件格式和数据编码的开放标准,以及提高信息管理素养,对于数字资源的长期使用和curation工作的成功都至关重要。

战略图书馆技术:当前现实与未来可能

Wiley于3月22日请Marshall Breeding做了一个网络报告,报告时长40多分钟,标题为:战略图书馆技术:当前现实与未来可能。会前需注册,现在视频应该是公开的:
Strategic Library Technologies – Current Realities and Future Possibilities

图书馆自动化系统】内容从图书馆自动化系统开始。有不少来自他的Library Technology Guides 网站数据作成的图表,比如:历年选择或放弃Symphony图书馆数量柱形图,2017年升级到Alma的图书馆之前所用系统饼图,澳大利亚公共图书馆所用系统分布饼图,多个系统的地理分布地图,自动化系统厂商员工数量统计等。
图书馆服务平台】也有他对图书馆自动化系统的总结。相对于原来图书馆集成系统(ILS或LAM)和图书馆服务平台(LSP)二分法,现在增加了介于两者之间的“进步ILS”。LSP只有3个,即OCLC的WorldShare、Alma和尚在开发中的FOLIO。其他如Sierra、SirsiDynix蓝云等都被归在中间这一类——尽管在“产品开发时间线图”中Sierra与其他LSP并列。从他总结的“资源管理模型”看,LSP与ILS/进步ILS的区别主要在于,其技术平台是多租户SaaS、具有知识库(电子馆藏与书目)、只通过API互操作(没有批传输)、采购方式是许可证。之前ILS与电子资源管理(ERM)是分列的,LSP将两者结合在一起。
支持研究与教学】如果说上面是现实,那么未来将超越LSP。报告指出,大学管理者不在意图书馆内部工作流程,LSP之后的技术与服务,要能让图书馆可以支持对大学有战略利益的领域,即研究与课程(教学)。新领域包括:研究数据管理,研究服务支持(展示研究与出版物、资助课题),教学支持(课程阅读列表、降低学生资料费用、版权管理)。(国内目前普遍比较重视研究服务支持即展示这一块(比如学者库),也体现了这一发展趋势)
学术出版转变】图书馆的上游,学术出版社有什么新服务?报告列举了3家企业及其相关工具:
Elsevier:引文库Scopus;索引6900万出版物;分析工具SciVal, PlumX;文献管理Mendeley;研究信息管理系统Pure;机构文章存储库bepress;科学协作网络SSRN
Digital Science:引文库Dimensions;索引8900万出版物;分析工具Altmetric;研究信息管理系统Symplectic;研究数据存储库FigShare
Clarivae:引文库Web of Science(6800万出版物);分析工具InSites;文献管理EndNote;期刊管理系统ScholarOne;同行评议追踪与识别Publons
没想到数字科学公司的引文库竟然数量最多,可谓后来居上。该公司为麦克米伦创立,孵化致力于科学工作流和研究生产力的初创公司如Symplectic、FigShare、Altmetric。

期待OCLC《研究数据管理的现实》系列报告中译版

去年9月29日看到OCLC副总裁Lorcan Dempsey推文,OCLC的《研究数据管理的现实》系列报告出了第2部分。OCLC研究部网站显示,此报告由4个部分和1个补充材料《University Service Profiles》组成:
The Realities of Research Data Management
《研究数据管理的现实》是一个4部分系列,探索研究型大学正如何应对在整个研究生命周期中管理研究数据的挑战。在本系列中,我们考察高等教育机构在建立或获取RDM【能力时所面临的环境、影响及选择——换言之,支持新兴的数据管理实践的基础设施、服务及其他资源。我们的发现基于在四个十分不同的国家环境中的四个机构的个案研究:爱丁堡大学(英国)、伊利诺伊大学香槟分校(美国)、莫纳什大学(澳大利亚)和瓦格宁根大学(荷兰)。
Part One: A Tour of the Research Data Management (RDM) Service Space 研究数据管理 (RDM) 服务空间之旅
Part Two: Scoping the University RDM Service Bundle 大学 RDM 服务包的界定
Part Three: Incentives 激励
Part Four: Sourcing and Scaling 采购和规模

当时就想等出完了再看。前几天在微信群中看到OCLC北京代表处首席代表丘东江先生介绍今年1月4日已出第3部分,并称已委托《图书馆杂志》编译前3个部分。《图书馆杂志》金晓明主编也明确已在编译中,将发在“图情报告”副刊。长篇报告不用看原文,真是省不少力。期待早日完成。

关于研究数据管理,可参见其他博文:
研究数据管理元数据(附OCLC研究报告《搭积木:为研究数据管理项目奠定基础》)(2016-6-2)
研究信息管理系统——机构库升级版?(2014-11-9)
– 介绍Lorcan Dempsey的博文
研究数据管理:课程与培训资料(2016-7-18)

附1:OCLC研究部每年都会发布一些报告,先前也有若干曾轰动一时的报告翻译为中文,此RDM系列当为第4个:
《2003年OCLC环境扫描》(清华大学图书馆译,非正式出版物,2005?)
– 参见Keven:读《2003OCLC环境扫描》(2005-5-31);再读OCLC2003环境扫描报告(2005-07-15)
2007年《网络世界的共享、隐私与信任》(清华大学图书馆译,《数字图书馆论坛》2008年第3期)
– 参见:OCLC成员报告“网络世界中分享、隐私与信任”:有趣的数字(2007-10-29)
《图书馆的认知度(2010):环境与社会》(上海图书馆夏磊和张帆译,《数字图书馆论坛》2011年第4期)

附2:《图书馆杂志》的《图情报告》副刊只查到一个,是2016年1月的“世界各国图书馆战略系列”,包括5个国家图书馆级的多年战略规划(2015-20XX年)。