康奈尔大学的研究数据管理服务

远洋师在书社会专业探讨区转贴了印第安那大学E-Science馆员的招聘新闻(ZT: E-Science Librarian招聘),并提供了该校的数据管理计划(Data Management Plans)链接。

目前来说,一些发达国家的公共研究资助部门要求资助项目的数据公开,这是OA与图书馆参与研究数据保存必不可少的前提。虽然这些前提在吾国尚不存在,但如果有一天条件具备了,图书馆是不是就能够胜任呢?毕竟科学数据与图书馆传统的文献差别极大。因之在远洋师的贴下提问:“如果学校行政对研究数据管理有要求,图书馆该如何做?有没有可以推荐的模式?”秦健老师推荐康奈尔,称“有很多创新,过去几年有许多关于这方面的项目,是走在前面的高校之一”。依秦老师提供的链接,做笔记。

康奈尔大学研究数据管理服务组 Research Data Management Service

同印第安那大学一样,康奈尔大学这方面工作的很重要前提是美国国家科学基金NSF从2011年开始的新政策,要求所有资助项目有一个数据管理计划。印第安那大学的相关文件存在图书馆的DSpace库中,而康奈尔大学的服务组从网址及页面看,并不是一个图书馆的项目,但图书馆是参与者。

———-关于———-

研究数据管理服务组的目标是尽可能使研究者获取所需服务简单化:

>向研究者提供一套连贯的服务

> 开发统一网页,提供一些通用信息,针对数据管理规划、校内现有服务,以及资助项目中用于数据管理计划的标准语言。

> 提供单点联系信息,研究者在需要时可得到专业帮助。

该小组由研究高级副教务长及图书馆馆长共同负责,并有一个教师组成的咨询委员会。

———-服务———-

康奈尔大学的研究数据服务由多个单位提供,小组网站提供的是一站式目录(入口)。图书馆参与其中部分。

> 数据管理规范概述:满足资助要求的资源及一般规划指南

> 存储与备份服务:短期与长期存储 [无图书馆服务]

> 元数据:数据文献

> 数据分析:统计分析

> 协作工具:协作与交流支持

> 高性能计算:系统与存储、编程、数据库系统、计算分析、可视化等 [无图书馆服务]

> 隐私和信任:满足对保护隐私和信任的要求 [无图书馆服务]

> 知识产权与版权:理解与保护你的知识产权 [无图书馆服务]

> 数据出版:让数据供他人使用

———-康奈尔大学图书馆(CUL)提供的服务———-

> 元数据

>> CUGIR:康奈尔大学地理空间信息存储库(帮助通过CUGIR发布的数据准备元数据)[特色库]

>> 元数据与批处理服务:元数据咨询、制作、转换、规范定制及其他服务 [编目&元数据]

> 数据分析

>> 基本地理信息系统(GIS)Mann及Olin图书馆的讲座 [培训]

>> 统计软件:带统计软件的公共计算机实验室 [IC]

> 协作工具

>> RefWorks/RefShare:前者是参考文献管理软件,后者让RefWorks用户共享其参考文献数据库

>> 视频会议 [IC]

> 数据出版

>> CUGIR:康奈尔大学地理空间信息存储库(纽约州GIS数据)[特色库]

>> eCommons:康奈尔大学图书馆的永久数字存储库 [IR]

从以上服务看,基本上在特色数据建设、机构库、信息共享空间及培训等范围内。其中机构库范围比较大,实际上可以无所不包;编目扩大到元数据值得关注。

Gorman推出应对RDA的“M氏规则解释”

MRIs: AACR2 Rule Interpretations(需注册登录,免费)【update 2016-3-24: 侧栏仍有登录框,但无需登录可查看内容】

AACR2主编Michael Gorman,在加拿大专业图书馆编目公司(SLC)的J. McRee Elrod帮助下,推出AACR2的M氏规则解释。其名称自然源于原美国国会图书馆对AACR2的规则解释(LCRI),M当指Michael/McRee。

据称使用MRI,可以在继续使用AACR2的情况下,使书目记录的著录与检索点与RDA兼容。MRI像是依据RDA对AACR2条款逐条作了修订。作者建议把MRI打印在活页纸上,夹在原来就是活页版的AACR2相应条款处。

MRI篇幅相当小,似乎意味着RDA在内容上与AACR2差别并不大(当然结构、用词有较大变化)。

对于用惯AACR2、缺少编目员培训费用、没有能力订购联机版RDA工具套件的小馆,或许MRI是个不错的替代品?与曾打算重起炉灶的“合作编目规则”(Cooperative Cataloging Rules)(请架梯)相比,此法可谓简单高效。

可以想见MRI是成不了主流的。在RDA-L邮件组中Karen Coyle对MRI很不以为然,但多元的社会,有不同见解很正常。前两天看到某博主对KC当年和Diane Hillmann写“RDA:20世纪的编目规则”很是愤懑呢。(参见:编目与元数据2009 (2010年1月3日))

Metadata: What I learned at ALA (June 30, 2011)(请架梯)

The main thing causing RDA to fail is a bullying article  published in 2007 in D-LIB magazine and written by Diane Hillmann and Karen Coyle. They used the article to pressure the Joint Steering Committee to poison RDA and to make the code conform to their needs (as consultants) and to make it MARC unfriendly and library unfriendly. Had they not interfered so much, the code would likely be successfully put in place by now.

参见:RDA:20世纪的编目规则 (2007年1月23日)

———-编目快速参考之RDA———-

SLC网站有一个编目快速参考栏目(Cataloguing Cheat Sheets),汇总编目各种类型文献时通常要用到的信息与做法。现在增加了RDA的内容,除了曾介绍过的RDA/AACR2 Changes外,还有Editing MARC Records (RDA)Monograph Cataloguing (RDA)(原有AACR2的相应参考)。按常用MARC字段顺序,列出常用值,特别指出RDA的变化,很实用。

参见:RDA与AACR2差别列表 (2011年2月19日)

RDA可能的修改及时间表

《美国RDA测试协调委员会报告与建议》的建议部分有五个建议,均列有时间表,分别面向:

1、三个国家图书馆(LC/NAL/NLM)

2、RDA开发联合指导委员会(JSC)

3、ALA出版社

4、社区[编目界](包括PCC)

5、厂商

Nalsi已经简要翻译了给LC/NAL/NLM的实施建议。这里翻译报告中给JSC的建议,看看接下来的一年中,RDA本身可能会有什么变化(方括号内为本人推定)。在RDA-L邮件组中看到了JSC主席、大英图书馆的Alan Danskin的礼节性回应。

p.15-16: Recommendations to the Joint Steering Committee for Development of RDA (JSC)

1. RDA的内容
a. 与CoP协作,确定并聘用写手,承担以清晰、无歧义、浅显的英语重写RDA用法说明的任务。

完成时间表:3个月内 [-2011.9]

b. 与测试协调委员会协作,基于本次测试收集的信息,确定优先重写的章节。

完成时间表:3个月内 [-2011.9]

c. 开始重写优先章节。

完成时间表:12个月内,即a和b完成后9个月内 [-2012.6]

d. 完成并公开RDA元素集与词汇表的联机注册,确保注册信息与RDA用法说明保持同步。

完成时间表:6个月内 [-2011.12]

e. 明确作品、内容表达、载体表现和单件间的边界

f. 明确不同发行模式编目资源的差异

g. 特定论题:

> i. 明确个人活动字段(RDA 9.15)与专业或职业(RDA 9.16)的区别,或者合并两个元素;确认这些元素或被合并的单一元素的受控词汇(MARC 372和374字段)。

> ii. 明确应用于内容表达的元素的识别

> iii. 讨论识别特定内容表达的需求,考虑未区分的规范检索点用于内容表达范畴的可能性(如对同一语种译本)

> iv. 修改会议的规范检索点的用法说明,明确何时会议出版物被当作连续出版物编目

> v. 明确在仍然使用具有多个FRBR第1组实体的属性的书目记录的实施场景中[?],使用RDA第17章

>vi. 明确对生产、出版、发行与制造陈述的用法说明(RDA 2.7-2.10)。同时允许重复这些元素,而非作随时间而变的附注。

> vii. 与不同的专业社区(如移动图像、音乐、珍本资料、连续出版物)共同工作,修改与增加用法说明

> viii. 对RDA第6章与9-11章,确认(用法说明中的)元素是否包括在规范检索点中

> ix. 在RDA 19.2, 19.3, 20.2, 21.2-21.6及22.2-22.4中,提供到创建与资源有关的个人、家族与团体的规范检索点的用法说明的链接

> x. 考虑需要使用与团体有关地点的规范检索点(RDA 11.13),使这一信息更能够机器操作

> xi. 在内容附注及包含在这些附注中的信息的使用上,增加更多用法说明(如,表演者名称的使用)

> xii. 与舆图社区一同工作,考虑与这些资源相关的个人、家族与团体的适当的关系指示词

2. 更新RDA的过程
a. 在联机环境下确定并公开RDA更新过程。

完成时间表:3个月内 [-2011.9]

b. 比过去更频繁地更新 [永远的beta版,在2012.6优先章节改写完成后,继续其他章节,并持续更新]

3. 强化RDA工具套件(注意3a-3e与给ALA出版社的建议重复)
a. 与ALA出版社一同工作,集成完整用例到RDA工具套件,包括特定社区的用例(如连续出版物、珍本书、音乐资源)

完成时间表:6个月内 [-2011.12]

b. 与ALA出版社一同工作,解决现有标记为“核心”的检索,检索到超出“核心”与“附加核心”元素之外用法说明的问题

c. 与ALA出版社一同工作,开发一种检索,仅针对“核心”及“如果……则核心”元素

d. 与ALA出版社一同工作,强调“元素集视图”的可得性与有用性,让编目员知道他们可以看到一个元素的所有用法说明 [元素集视图在“工具”部分,容易被忽略,而其可用性或许在正文之上]

e. 与ALA出版社一同工作,以某种方式表明RDA内容及相关文献已被更新 [更新过的内容有特别的标记,如MARC标准网站上标为红字?]

f. 提供RDA元素到其他元数据标准的映射:MODS、MADS、METS、DC等 [RDA到MODS的映射已经挂在工具套件网站上了]

———-给LC/NAL/NLM的实施建议———-

录自Nalsi的西文编目笔记III:RDA测试报告及其实施声明

用简单、无歧义的英语重写;

定义在网络环境下升级RDA的程序;

增加RDA工具包的功能;

开发完整的RDA记录样例,使用MARC格式和其他编码方案;

RDA元素集和词汇表网络注册的宣布完成;

开展可靠的进程,以取代MARC格式:18-24个月完成;

保证并且促进社区参与;

领导并且协调RDA的培训;

征求RDA元素集的搜索工具和原型输入端(prototype input)。