数据保管:图书馆能做什么?

此次出行回程时,邻座的教授在飞机上处理自己拍摄的某次野外考察照片。处理完后他还给我介绍了些其他文件夹中的照片,大部分照片都没有重新命名──对他来说含义及价值一目了然,对其他人则需要他做解释了。问了他照片本身是否带地理信息,回答是肯定的。
后来聊到我国在资料上的落后,我举了军舰南海搁浅的例子。据他说我国刚拼成了领海海底资料,其中有些地区的图还是1880年代外国人留下的,这么多年海底会有很大改变的。
再谈及原始资料及其保存的重要性。他说到有很多原始资料,做完某项研究后就不知所终,其他人要做作同样的研究,就得重复做;而有些历史资料,是无法重复的;资料还常随研究人员的退休、离职等原因消失,有时能联系上本人,且本人也愿意提供,有时就没那么好运气了。
问到数据的长期保存,他本人用刻光盘(包括过几年再复刻一次)、大容量移动硬盘方式备份;手上还有早至七八十年代的照片需要数字化保存,但目前扫描后精度比不上原始照片;单位里也有早年从美国买来的缩微遥感图片,现在要花大价钱才能获取的(近年的可在网上免费得到),这就是历史资料的价值了。

因之想到向他了解在我国,图书馆做数据保管(Data Curation)的可能性:
1、老师有没有这样的意愿?比如会不会考虑不想让其他人获取自己的资料?
答曰:保存资料的需求是有的,而保密则不单是本人的考虑,国家也对某些原始资料的发布有所限制。
2、图书馆有没有可能做数据保管?
答曰:原始图片的价值在于对图片的说明,这需要专业人员来做,而专业人员通常更愿意把时间花在做更有价值的事情上。他们单位设立了信息中心,由研究能力欠缺者专事资料搜集整理。
──显然,图书馆很难拥有这么专业的知识。一般的专业背景应该是远远不够的。

对前一个问题,想到在目前的环境下,图书馆能不能像接受图书捐赠那样,在教师退休或不再从事研究以后,接受其电脑中的研究资料,并开放,以使物尽其用?
后一个问题,很多院系恐怕并未像他们那样有专门的信息中心,资料室所做也没涉及到机读资料,图书馆有拓展的空间。但缺乏深入的专业知识,对想要从事数据保管工作的图书馆,始终是不可回避、或许也是无解的问题?

图书馆的资源收集存在危机,而独有的原始资料,一需要深入的揭示,二也需要积累,其价值才会逐渐显现的。从图书馆方面来说,其效果显现会相当的慢。虽然图书馆危机论四起,但那不是将来的事吗?所以动力怕也是不足的。而真的事到临头,却又不及积累……
──其实问题的关键的是,国家层面没有OA的强制政策(甚至还对“保密”有很高的要求)。转录“Data Curation:数据监护?数据保管?”(2011年5月22日)中的一段笔记:
美国这方面有加速的趋势,并不是教授本人有这方面的需求,而是提供研究基金的机构如NSF对数据保管提出要求,教授不得不了解如何让数据被别人共享,而大学管理层也有这方面的压力。开放存取在美国已经是自上而下的要求,在中国的管理层还没有考虑到这一层。一旦走到这一步,中国的发展也会很快,但图书馆恐怕也需要努力,才能参与进去,毕竟档案馆也会是很有力的竞争者。

Data Curation:数据监护?数据保管?

在书社会读到二则会议信息,都涉及Data Curation,看来是越来越热了。之前曾在“2010美国大学图书馆馆长调查:图表及其解读”(2011年4月9日)博文末乱解道“似乎OA也是图书馆比用户更感兴趣,如同机构库(IR)、数据监护/保存(Data Curation)……”
———- 之一:美国富布赖特学者西安电子科技大学图书馆讲学 ———-

图书馆网站消息:美国富布赖特学者来我馆讲学课件下载

加州大学圣巴巴拉分校Davidson图书馆地图与图像实验室主任Jon R. Jablonski副教授于5月20日在逸夫图书馆报告厅做了三个学术报告。第三场报告:Drowning in data? how librarians preserve research results through data curation?(PPT含部分中文,例子为武汉大学,看来先期在武大做过报告)

via 西北图客:美国富布赖特学者Jon R. Jablonski西安讲座参会记 (2011-05-21)

via 慢慢悠悠:Jon 讲座资料已在西电图书馆网站发布
———- 之二:「E-Research:新世代學術研究之利器」研討會 ———-

杨美华教授在书社会介绍台大图书馆等于5月17日邀请伊利诺大学图书馆的Paula Kaufman馆长和Sarah Shreeves副教授与宾州州立大学图书馆Partricia Hswe博士,举办「E-Research:新世代学术研究之利器」研讨会。博文标题为“高校图书馆在新时代的新角色:Digital Curation for Preservation”,最后提到Data Curation/Digital Curation在台湾尚无贴切译法。

关于此次会议,可访问:

会议网站:「E-Research:新世代學術研究之利器」研討會

中华民国图书馆学会电子报:5/17 「E-Research:新世代學術研究之利器」研討會
———- UIUC暑期班的Data Curation ———-

想到去年的UIUC暑期班,Paula Kaufman馆长和Sarah Shreeves副教授都曾给我们上过课,Paula讲《学术图书馆的领导》,Sarah分别讲HathiTrust和IDEALS (Illinois Digital Environment for Access to Learning and Scholarship)。当时Data Curation是图情学院研究助教Melissa Cragin讲的,她申请到了一个ILMS项目Data Curation Education Program($852,502?真是一大笔呀)。
找出当时笔记,照录:
“图情学院研究助教Melissa Cragin讲科技数据保管(Data Curation, DC),介绍了众多网站与项目。正式出版物变为native digital,图书馆收藏的内容因之需要转向非正式出版物了。以前只以为是e-Science的内容,从介绍上看,霍普金斯大学图书馆等已经参与进去了。印象最深的是说:了解科研流程与工具,以便更好地支持科研工作,如同1940-60年代了解(情报)用户(需求)那样。美国这方面有加速的趋势,并不是教授本人有这方面的需求,而是提供研究基金的机构如NSF对数据保管提出要求,教授不得不了解如何让数据被别人共享,而大学管理层也有这方面的压力。开放存取在美国已经是自上而下的要求,在中国的管理层还没有考虑到这一层。一旦走到这一步,中国的发展也会很快,但图书馆恐怕也需要努力,才能参与进去,毕竟档案馆也会是很有力的竞争者。伊大争取到项目在2008年开始暑期培训班,按申请时承诺,分享课程,以后可以去网站看看。”
暑期班同学杨鹤林在《大学图书馆学报》今年第2期发表了“数据监护:美国高校图书馆的新探索”(PDF下载),也是暑期班的收获吧。

[update 2012-4-16] Research Data Curation Bibliography (2012-4-16) / Charles W. Bailey, Jr.
包括100多篇英语文章及技术报告,基本上发表在2000-2011年间,大多数提供自由获取版本的链接。以创作共用署名-非商业协议发布

[update 2012-6-12] 更新版:Digital Curation Bibliography: Preservation and Stewardship of Scholarly Works / Charles W. Bailey, Jr. Houston, TX : Digital Scholarship, 2012. ISBN 1477497692 and ISBN-13: 9781477497692(有OA版下载)
收录650多英语文章、图书、技术报告,主要发表在2000-2011年间,提供自由获取版本的链接。