研究数据管理元数据(附OCLC研究报告《搭积木:为研究数据管理项目奠定基础》)

由于众多研究资助机构要求受助者让数据可公共获取,研究数据管理(RDM,数据监护Data Curation的近义词)在欧美相当受重视,一些图书馆开始主动寻求满足研究者在这方面的需求。OCLC研究部2016年4月13日发布研究报告《搭积木:为研究数据管理项目奠定基础》,为高校启动研究数据管理项目提供指引。从初级的提供信息(第1部分)到实际推出服务(第2部分),报告提供了大量参考资料,包括各机构实施样例与可用资源。

研究数据管理中离不开元数据。“数据只有在可被理解时才是有用的。鼓励研究者提供有关其数据的结构化信息,提供情景与含义,让其他人查找、使用并适当引用数据。至少建议研究者清楚告知他们的故事:如何收集和使用数据、为什么目的。这样的信息最好放在readme.txt文件中,并包含项目信息、项目级元数据,以及有关数据本身的元数据(如文件名、文件格式、所用软件、题名、作者、资助者、版权所有者、描述、关键词、观察单元、数据种类、数据类型和语言)。”(第8页)
对研究者来说,提供元数据可能是个负担,也需要获取帮助——对图书馆来说,就是提供培训;在实施阶段,也包括代研究者做质量控制与清洗。

本报告“元数据”提供的参考资料,包括如何撰写、可用工具、元数据标准清单:
• Cornell University. “Guide to Writing ‘readme’ Style Metadata.” 康奈尔大学(准备元数据文档)
• DMPTool. “Data Management General Guidance: Metadata Data Documentation.” (元数据文档制作工具)
• DCC. “Disciplinary Metadata.”  (英国)数据监护中心:学科元数据一览(生物、地球科学、通用研究数据、物理学、社会与人文科学)
• Research Data Alliance (RDA). “Metadata Directory.” 研究数据联盟:元数据标准目录(艺术与人文科学、工程、生命科学、物理学和数学、社会和行为科学、通用研究数据)

元数据中有“唯一标识符”,包括个人ID、数据集ID及数据集的引用格式,可用于追踪下载、引用及影响测度。数据集有DOI、Handle、ARK(档案资源键),个人有ORCID和ISNI(没提ResearcherID),相关参考资料:
• California Digital Library, University of California Curation Center. “EZID.” 加州数字图书馆、加州大学监护中心:EZID(有偿提供DOI和ARK创建与维护,每年300-2500美元不等)
• International DOI Foundation. “DOI Registration Agencies.”
• ORCID, Inc. “Register for ORCID ID.”  个人ID(开放研究者与贡献者ID)
• ISNI International Agency. “Do you have an ISNI?” 个人ID(国际标准名称标识符)
• DataCite. https://www.datacite.org/

via hangingtogether.org: Metadata for research data management / Karen Smith-Yoshimura (2016-4-18)

——— 搭积木:为研究数据管理项目奠定基础 ———
Erway, Ricky, Laurence Horton, Amy Nurnberger, Reid Otsuji, and Amy Rushing. Building Blocks: Laying the Foundation for a Research Data Management Program. Dublin, Ohio: OCLC Research, 2016.

第1部分:打下基础
需求评估
提供信息(培训,数据管理规划,活动数据管理,元数据,权利与隐私,数据发布、保存与存档)
通告、推广与宣传
第2部分:建立与推出
需求评估(单位、研究者)
定义政策、指南与策略
提供服务(培训,数据管理规划,活动数据管理,元数据,数据发布、保存与存档)
通告、推广与宣传(社区参与与告知,在线呈现,合作发展)

参见荔园图志:OCLC Research发布“建立科研数据管理新基础”的报告 (2016-6-1)

OCLC官方博客Next开张

在博客差不多被人遗忘的年代,OCLC本月新开顶级官方博客(http://www.oclc.org/blog),名为Next,提供有关全世界图书馆工作的见解与信息。要跟踪图书馆行业热门话题,应该是个不错的场所。

简介(About)
OCLC相信,我们所知道的必须共享。这样,可以共同让突破成为可能。Next是OCLC领导者分享其见解与经验的地方,让图书馆可由OCLC合作成员所做工作获益。话题涵盖整个图书馆职业,重点在知识管理的未来、图书馆转型以及图书馆如何更好地融入其用户的生活。
【Because what is known must be shared:这句话也显示在OCLC主页About OCLC的最末】

所列作者4人,以OCLC总裁为首。开博两周,每个作者均已发文一篇,依次为:

Skip Prichard(总裁兼CEO,2013年加入OCLC),话题:大数据
Transforming data into impact (08 February 2016)

Roy Tennant(高级项目主任,2007年加入OCLC) ,话题:关联数据
Getting started with linked data (08 February 2016)

Sharon Streams(WebJunction主任,2007年加入OCLC) ,话题:学习
Learning isn’t learning until you use it (08 February 2016)

Chip Nilges(商务开发副总裁,2007-;1994年由FirstSearch团队成员加入OCLC,管理参考与馆际互借服务,领导新产品如Worldcat.org,QuestionPoint和WorldCat Local),话题:合作
The library of one (15 February 2016)

附记:2007年不少重量级人物加盟OCLC。参见:
《RLG数字新闻》休刊 & Roy Tennant加盟OCLC(2007-4-26)
OCLC的新副总裁:Karen Calhoun(2007-03-27)
【2016-2-10网站快照显示OCLC现有8个副总裁,没有Karen Calhoun。LinkedIn显示她2011年5月离开OCLC,现从事图书馆咨询。美国图书馆咨询业真是发达,当年的网络名人们一个个都咨询了】

OCLC结束目录卡片打印业务

OCLC在2015年9月30日关闭了持续45年的图书馆目录卡片打印服务,累计提供目录卡片19亿张。10月1日,在OCLC总部有一个象征性的结束活动,印刷最后一批卡片,包括OCLC现任总裁Skip Prichard、本批卡片订购方馆员、当地图书馆员及媒体在内的数十人,在位于地下室的印刷所内见证了这一时刻,被当地媒体称为“一个时代的终结”。

来自:Columbus Dispatc

OCLC的卡片目录并不是单元目录卡,如我们国家以前随书配卡那样,所有图书馆相同、一本书多张相同的半成品,而是格式可由图书馆定制、依目录类型不同且排好序的,图书馆收到后可以直接排进目录的(估计没见过卡片目录的人也听不明白怎么回事)。服务始于1971年OCLC开始联机编目,到1985年达到巅峰,年印刷卡片1.31亿张,每周发送卡片约4千包、计8吨重。此后随着越来越多图书馆开始用电子目录取代卡片目录而持续下降,去年订单量降至不足百万张。印刷所也在不知什么时候,由最初的二楼阳光房最终搬到了地下室(悽惨的景象;虽然从报道看还有其他印刷业务)。
很难想像美国竟然还有图书馆用卡片目录,而且每年还有近百万张卡片的订单。通常一种资源需要多张检索点的卡片(报道中称某DVD有9张),如此大约也有十多万种,或许涉及数十家图书馆。现在应该没有OCLC的成员馆用卡片目录了,所以基本上如报道中所说,只是用作备份——备份还要多排多套目录,也真是人员富裕过头了。

参见:
OCLC News releases: OCLC prints last library catalog cards
OCLC Catalog Cards
Columbus Dispatc: Dublin’s OCLC prints last library catalog card: Relic of pre-digital era fades away