查找研究数据存储库的注册库re3data.org

re3data.org(REgistry of REsearch data REpositories) 是综合性的全球研究数据存储库注册库,向研究者、资助机构、出版者和学术机构呈现永久保存与访问数据集的存储库,促进研究数据的共享文化、增加访问以及更好的可见性。re3data.org于2012年秋上线,由德国研究基金(EFG)资助,项目合作方包括洪堡大学的柏林图情学院、德国地球科学研究中心图情服务部、德国卡尔斯鲁尔理工学院图书馆及美国普渡大学图书馆。(About

2014年re3data.org宣布与另一个注册项目Databib合并以减少重复工作(DataCite, re3data.org, and Databib Announce Collaboration (March 25, 2014))。
合并于一年后完成,并开始提供搜索API(Merger of Databib and re3data.org, first version of API available (March 9, 2015))。
2015年8月re3data.org宣布与DataSite合作,使用DOI为re3data.org记录提供永久标识符,并自动生成引用格式(Introduction of the re3data.org persistent identifier (August 26, 2015))

2016年1月re3data.org发布3.0版元数据方案(New re3data.org Schema and Search Functionality (January 20, 2016)),用于描述研究数据存储库:
Metadata Schema for the Description of Research Data Repositories (version 3.0, Dec 2015)
DOI: http://doi.org/10.2312/re3.008

re3data.org收录研究数据存储库数量在2014年11月超过1000,2016年4月超过1500(re3data.org Reaches a Milestone & Begins Offering Badges (April 13, 2016) http://www.re3data.org/2016/04/re3data-org-reaches-a-milestone-begins-offering-badges/)
Indexed Research Data Repositories

re3data.org提供直接搜索与按主题、内容类型和国家的浏览。
国家浏览是地图形式(有墙),中国有25个结果,约半数是多国合作的存储库。包括北京大学开放研究数据平台,但没有复旦大学社会科学数据平台。
Badge of Peking University Open Research Daa

参见:Dataverse:开源的研究数据存储库软件

Dataverse:开源的研究数据存储库软件

Dataverse项目是一个开源的研究数据存储库软件,由哈佛大学的量化社会科学研究所(Institute for Quantitative Social Science, IQSS)开发,始于2006年。2016年6月刚发布4.4版,月底将发布4.5版。
网站首页面向有研究数据管理需求的各方,介绍不同的解决方案:
研究者:保存本人的研究数据。选择包括:本机构的存储库,或者Harvard Dataverse。
期刊:管理研究数据的提交、评审与发布,并与发表的文章在网站上同时显示。选择包括:使用Dataverse插件,向作者推荐存储库,建立期刊自己的存储库。
机构:需要托管研究数据,可以直接使用Harvard Dataverse,为本机构做定制;也可以自己安装Dataverse软件。
另外,作为一个开源软件,自然也希望开发者加入Dataverse开发者社区,贡献、集成与参与。

网站首页下部地图显示目前的19个安装,分布在欧洲、美洲和亚洲,其中包括中国大陆2家(北京大学、复旦大学)、香港1家(香港科技大学)。这3所大学研究数据平台的建立,图书馆也都起着重要作用。

——— Harvard Dataverse ——–
由哈佛图书馆和哈佛大学信息技术部门(HUIT)与IQSS协作建立,提供对研究数据的分享、引用、分析与保存,对全世界所有学科的所有科学数据开放。
目前有1688个库(Dataverse)、61860个数据集、33万多个文件。

———复旦大学社会科学数据平台(服务于本校研究人员)———
Fudan University Dataverse Network
Powered by the Dataverse Network Project v.3.3。布局同哈佛库的页面下部。
平台发展历程
复旦大学社会科学数据研究中心,在2012年经过广泛的调研包括对美国多所著名高校实地考察,最后决定和哈佛大学进行合作,2013年3月和哈佛大学的Dataverse Network系统签署了全面合作协议。复旦大学不仅是Dataverse Network的使用者,更是哈佛大学的合作伙伴,帮助共同推进Dataverse的国际化和新功能的开发。
复旦大学全面负责Dataverse中文版的研发和中国地区的宣传推广,2013年6月正式发布Dataverse汉化3.3版本,致力于为Dataverse中文版用户提供技术支持服务。

Dataverse项目博客2015年2月的博文(Featured Dataverse Repository: Fudan University):复旦大学平台2014年12月发布,收录复旦所属1319位研究者、5796个项目的4.6万个文件。文末致谢殷沈琴、张计龙。(这几年听过多次两位的相关报告)

——— 北京大学开放研究数据平台(面向全球开放)———
Peking Univeristy Open Research Data
Powered by Dataverse Project v.4.0(未出现在首页,仅在“关于”页)
目前有16个库(数据空间)、79个数据集。首页“精品数据空间”比较吸引眼球(布局近似哈佛库的页面上部)
简介(关于):
由北京大学图书馆、国家自然科学基金-北京大学管理科学数据中心、北京大学科研部、北京大学社科部联合主办和推出。
平台建设工作历时近两年。从2014年初开始,北京大学图书馆……进行前期调研和平台选型,并基于哈佛大学开源软件Dataverse搭建测试数据平台……相继完成了一系列工作,包括:元数据方案制定和改造,正式加入Datacite数据中心获取正式DOI,根据本地化需求进行系统功能设计和二次开发、制定平台章程和用户使用协议、研究数据的收集/整理/发布。2015年12月25日,平台Beta版开始上线运行。
平台不仅面向北大师生,也面向全国和国外,收录国内和国外、学界和非学界相关组织的优质科研数据。

——— 香港科技大学DataSpace@HKUST ———
Powered by Dataverse, © 2016 HKUST Library
3个库、4个数据集、98个文档,均发布于2015年。规模不大。

研究数据管理元数据(附OCLC研究报告《搭积木:为研究数据管理项目奠定基础》)

由于众多研究资助机构要求受助者让数据可公共获取,研究数据管理(RDM,数据监护Data Curation的近义词)在欧美相当受重视,一些图书馆开始主动寻求满足研究者在这方面的需求。OCLC研究部2016年4月13日发布研究报告《搭积木:为研究数据管理项目奠定基础》,为高校启动研究数据管理项目提供指引。从初级的提供信息(第1部分)到实际推出服务(第2部分),报告提供了大量参考资料,包括各机构实施样例与可用资源。

研究数据管理中离不开元数据。“数据只有在可被理解时才是有用的。鼓励研究者提供有关其数据的结构化信息,提供情景与含义,让其他人查找、使用并适当引用数据。至少建议研究者清楚告知他们的故事:如何收集和使用数据、为什么目的。这样的信息最好放在readme.txt文件中,并包含项目信息、项目级元数据,以及有关数据本身的元数据(如文件名、文件格式、所用软件、题名、作者、资助者、版权所有者、描述、关键词、观察单元、数据种类、数据类型和语言)。”(第8页)
对研究者来说,提供元数据可能是个负担,也需要获取帮助——对图书馆来说,就是提供培训;在实施阶段,也包括代研究者做质量控制与清洗。

本报告“元数据”提供的参考资料,包括如何撰写、可用工具、元数据标准清单:
• Cornell University. “Guide to Writing ‘readme’ Style Metadata.” 康奈尔大学(准备元数据文档)
• DMPTool. “Data Management General Guidance: Metadata Data Documentation.” (元数据文档制作工具)
• DCC. “Disciplinary Metadata.”  (英国)数据监护中心:学科元数据一览(生物、地球科学、通用研究数据、物理学、社会与人文科学)
• Research Data Alliance (RDA). “Metadata Directory.” 研究数据联盟:元数据标准目录(艺术与人文科学、工程、生命科学、物理学和数学、社会和行为科学、通用研究数据)

元数据中有“唯一标识符”,包括个人ID、数据集ID及数据集的引用格式,可用于追踪下载、引用及影响测度。数据集有DOI、Handle、ARK(档案资源键),个人有ORCID和ISNI(没提ResearcherID),相关参考资料:
• California Digital Library, University of California Curation Center. “EZID.” 加州数字图书馆、加州大学监护中心:EZID(有偿提供DOI和ARK创建与维护,每年300-2500美元不等)
• International DOI Foundation. “DOI Registration Agencies.”
• ORCID, Inc. “Register for ORCID ID.”  个人ID(开放研究者与贡献者ID)
• ISNI International Agency. “Do you have an ISNI?” 个人ID(国际标准名称标识符)
• DataCite. https://www.datacite.org/

via hangingtogether.org: Metadata for research data management / Karen Smith-Yoshimura (2016-4-18)

——— 搭积木:为研究数据管理项目奠定基础 ———
Erway, Ricky, Laurence Horton, Amy Nurnberger, Reid Otsuji, and Amy Rushing. Building Blocks: Laying the Foundation for a Research Data Management Program. Dublin, Ohio: OCLC Research, 2016.

第1部分:打下基础
需求评估
提供信息(培训,数据管理规划,活动数据管理,元数据,权利与隐私,数据发布、保存与存档)
通告、推广与宣传
第2部分:建立与推出
需求评估(单位、研究者)
定义政策、指南与策略
提供服务(培训,数据管理规划,活动数据管理,元数据,数据发布、保存与存档)
通告、推广与宣传(社区参与与告知,在线呈现,合作发展)

参见荔园图志:OCLC Research发布“建立科研数据管理新基础”的报告 (2016-6-1)