研究数据管理:课程与培训资料

五月底看OCLC研究报告《搭积木:为研究数据管理项目奠定基础》(参见:研究数据管理元数据,2016-6-2) ,在其培训的实例部分,排在首位的是Coursera《研究数据管理与共享》课程(Research Data Management and Sharing),觉得应该适合自己全面了解这个问题,就去看了下,6月20日开课,立刻注册。
本课程由北卡大学教堂山分校开设,是IMLS资助的CRADLE项目所开发。课程共5周,图情学院Helen Tibbo教授主讲,英国爱丁堡大学数字监护中心(著名的DCC)Sarah Jones讲授第3周。课程针对研究者和向研究者提供咨询的信息专业人员。
课程大纲
第1周-理解研究数据(什么是数据;理解数据管理)(作业:描述数据)
第2周-数据管理计划(作业:撰写DMP)
第3周-处理数据(组织数据;文件格式与转换;文档化与数据引用;存储与安全)
第4周-分享数据(分享基础;达成分享)(作业:引用数据)
第5周-存档数据(保存基础;值得信任的存储库)(作业:寻找值得信任的存储库)

这是我的第11门MOOC课程,和去年的《数据科学》9门课相比,文科课程学起来实在过于轻松。虽然并非所有Quiz都是一次全对,但Quiz和作业实际都挺简单。每次Quiz前都选择身份认证,提前一周完成课程后,决定付$29拿自己第一个Coursera证书。当然这个证书一点用都没有,摆着当装饰品就好。(照片审核还需一周,完成后加链接) [update 2016-7-20 实际审核2天]
题外话:去年3月付费还需要信用卡、收美元,现在已经可以使用强大的支付宝了,直接以美元卖出价收取人民币。

附:配合本课程学习所写博文
Dataverse:开源的研究数据存储库软件
查找研究数据存储库的注册库re3data.org
研究数据管理计划撰写工具:DMPTool

——— MANTRA:研究数据管理培训 ———
前述OCLC研究报告实例中还有爱丁堡大学的《MANTRA: Research Data Management Training》,也是本课程开始时强烈推荐的免费在线培训资源。
9个模块(解释研究数据,数据管理计划,组织数据,文件格式与转换 ,文档、元数据、引用,存储与安全,数据保护、权利与访问 ,分享、保存与许可,数据处理课程),前8个模块与上述5周课程内容基本一致,最后1个是软件操作。
MANTRA的特别之处是有分别针对学生、研究人员和信息专业人员的定制培训课程,针对性更强。并且所有资料都是CC-BY许可,只需引用即可随意使用,特别适合自制培训资料。对我们来说,不利之处是视频都在YouTube上,得架梯。

研究数据管理计划撰写工具:DMPTool及其他

研究数据管理的一项重要工作,是按照资助机构的要求撰写数据管理计划(DMP)。目前有若干工具,帮助研究者撰写DMP。

——— 美国:DMPTool ———
DMPTOOL是加州数字图书馆(CDL)所属UC3(UC Curation Center)的一项服务,帮助DMP的撰写、分享与管理。
该服务目前有189个合作者,包括美国的主要研究资助机构,以及其他研究机构和大学。成为合作者的要求是:认同合作者原则,并完成以下至少一项:1、建立机构认证(Shibboleth、LDAP等);2、做机构定制(资源、帮助等);3、参与代码维护与强化。
个人使用该服务需要注册。如为上述合作机构成员,可以选择所属机构(需要认证),否则选择无所属机构。

– 撰写功能
DMPTOOL帮助撰写的重要机制是提供各种模板,由前述合作机构提供。不同模板需要提供的信息及顺序不尽相同。模板对所需各部分内容有逐项的解释(Instructions)和撰写指导(Guidance)。
撰写DMP过程中,可以选择研究资助机构或其他机构的模板,也可以复制现有DMP——包括公开分享的、本机构内分享的以及自己以前创建的。
DMP完成后可导出PDF或Word格式文件。
– 社会化功能
自己的DMP,可选择分享或私有。
还能选择本DMP的共同拥有者,具有读写功能,可以共笔完成DMP撰写任务。
– 机构管理功能
合作机构除了提供模板外,还能设置对机构所属个人用户的DMP的审核等。
– 查找DMP
自由文本查找。比如输入资助机构的项目,如美国国家科学基金的社会、行为和经济科学项目(NSF-SBE),只输入SBE就能准确查找。

——— 英国:DCC ———
英国的数字监护中心(Digital Curation Centre, DCC)源自爱丁堡大学、格拉斯哥大学和UKOLN(巴思大学)等,也有一个在线DMP撰写工具:DMPonline
DMPonline针对英国机构,功能与DMPTool类似,目前已开始与UC3合作。

DCC还有一个数据管理计划检查表,为撰写DMP提供通用的模板:
DCC Checklist for a Data Management Plan
不想在网站注册的,可以参考此“检查表”撰写DMP。

查找研究数据存储库的注册库re3data.org

re3data.org(REgistry of REsearch data REpositories) 是综合性的全球研究数据存储库注册库,向研究者、资助机构、出版者和学术机构呈现永久保存与访问数据集的存储库,促进研究数据的共享文化、增加访问以及更好的可见性。re3data.org于2012年秋上线,由德国研究基金(EFG)资助,项目合作方包括洪堡大学的柏林图情学院、德国地球科学研究中心图情服务部、德国卡尔斯鲁尔理工学院图书馆及美国普渡大学图书馆。(About

2014年re3data.org宣布与另一个注册项目Databib合并以减少重复工作(DataCite, re3data.org, and Databib Announce Collaboration (March 25, 2014))。
合并于一年后完成,并开始提供搜索API(Merger of Databib and re3data.org, first version of API available (March 9, 2015))。
2015年8月re3data.org宣布与DataSite合作,使用DOI为re3data.org记录提供永久标识符,并自动生成引用格式(Introduction of the re3data.org persistent identifier (August 26, 2015))

2016年1月re3data.org发布3.0版元数据方案(New re3data.org Schema and Search Functionality (January 20, 2016)),用于描述研究数据存储库:
Metadata Schema for the Description of Research Data Repositories (version 3.0, Dec 2015)
DOI: http://doi.org/10.2312/re3.008

re3data.org收录研究数据存储库数量在2014年11月超过1000,2016年4月超过1500(re3data.org Reaches a Milestone & Begins Offering Badges (April 13, 2016) http://www.re3data.org/2016/04/re3data-org-reaches-a-milestone-begins-offering-badges/)
Indexed Research Data Repositories

re3data.org提供直接搜索与按主题、内容类型和国家的浏览。
国家浏览是地图形式(有墙),中国有25个结果,约半数是多国合作的存储库。包括北京大学开放研究数据平台,但没有复旦大学社会科学数据平台。
Badge of Peking University Open Research Daa

参见:Dataverse:开源的研究数据存储库软件