研究信息管理系统——机构库升级版?

十月下旬,几乎同时发生了两件与研究者标识(ID)相关的事。一是中科院文献情报中心建立ORCID中国平台,一是高校系统成立“中国大学学者标识建设及服务推进工作组”(后者未见报道,感谢云影提供会议资料)。与之密切相关的,是几个围绕研究者信息的系统,一是清华大学的“清华学者”网,一是中科院“中国科学家在线”(iAuthor)——系统看上去就像升级版的机构库。
正在此时,看到了OCLC副总裁Lorcan Dempsey在差不多时间发表的长篇博文,全面介绍“研究信息管理系统”——这不正是类似升级版机构库的系统吗?或许因为Dempsey是英国人,不那么美国中心,常在博文中介绍美国以外的事情。RIM就是先流行于美国以外的大学,而美国现在也开始感兴趣了。
博文信息量很大。其中对于图书馆,可以认为其中心思想是:大学里对研究信息管理感兴趣的机构很多,图书馆要抓住机会,进一步参与支持大学的研究生活。这与我的想法很合拍。
以下为摘编译。

———-研究信息管理系统——一种新的服务类别?———-
Lorcan Dempsey’s Weblog: Research information management systems – a new service category? (2014-10-26)

近年兴起的“研究信息管理”(RIM,Research Information Management),由“研究信息管理系统”(RIMs)支撑,早年称作“当前研究信息系统”(CRIS,Current Research Information System)。

【RIM:目标、成果、动机】
RIM指有关研究生命周期和参与实体(如研究者、研究成果、机构、资助、设施……)信息的集成管理。目标是在大学各部分同步数据,减少所有参与研究过程数据收集和管理者的负担。成果是提供对机构研究活动更大的可见度。动机包括更好的内部报告和分析,支持合规管理与评估,通过对研究专长与成果的有组织的披露,改善声誉管理。

【功能】
* 【资助】奖项管理与奖项机会识别。匹配潜在资助源的兴趣,支持资助与合约活动的管理与沟通。
* 出版管理。收集关于研究者出版物的数据。常通过搜索外部来源(如Scopus和WOS)帮助填充文档,提供通告保持更新。
* 专业简历的协调与发布。集中维护专业简历。从不同系统抽取数据。可能用于内部报告或评估目的,支持为研究者个人提供各种所需表格的个人数据(例如不同资助机构),用于通过机构研究门户等发布到网上。
* 研究分析/报告。提供关于研究活动和研究兴趣的管理信息,跨系、小组和个人。
* 遵从内部/外部规定
* 支持开放获取。与机构库同步,管理存储需求,与开放获取政策的信息源集成。

【软件】产品
-主要产品
–爱思维尔的Pure
–汤森路透的Converis
Symplectic Elements(有麦克米伦出版社背景)

-相关产品
infoEd Global(电子研究管理)
Ideate(研究管理应用的综合套件)
VIVO(发现跨机构研究者,开源语义网应用)(Pure和Symplectic可接口至VIVO)
Kuali Coeus for Research Administration(研究管理综合系统,开源)

-机构库扩展
DSpace和Eprints都写了扩展,提供某些类似RIMs的支持。例如Dspace-Cris扩展了Dspace模型以迎合Cerif实体【见“标准”】,基于为“香港大学学术库”所做的工作。

标准【2种数据格式】
CERIF(Common European Research Information Format):通用欧洲研究信息格式,来自EuroCRIS(欧洲国际研究信息组织),提供RIM系统间数据交换格式
Casrai词典(Consortia Advancing Standards in Research Administration Information):推进研究管理信息标准联盟词典

【已上线的系统】
-国家级
–南非:DST/NRF RIM(科技部与国家研究基金研究信息管理系统)
–挪威:CRIStin(挪威当前研究信息系统)
–荷兰:Metis(研究信息数据库)

-机构级
–伦敦大学皇家霍洛威学院【使用Pure,大学计算中心负责】
–香港大学:发展机构库,包含RIM或CRIS特性【HKU Scholars Hub(香港大学学术库)
–英国阿伯丁大学:同时有RIM和IR(更常见)【Research Output:机构库名Aberdeen University Research Archive (AURA);研究信息系统用Pure】
–贝尔法斯特女王大学:研究门户,由Pure支持【Research Portal

图书馆【在其中扮演什么角色】
近年发生的有趣的事情之一是,校园各种其他玩家,正围绕可能与图书馆兴趣重叠的数字信息管理开展服务日程,包括如IT【在我国可能是学校网络中心】、教学支持和大学出版社。这与另一个趋势一致,即对追踪、管理和披露机构的研究和学习成果的不断增长的兴趣:研究数据、学习资料、专业简历、研究报告和文章等等。这两个趋势交汇,意味着图书馆现在与研究办公室【在我国大约是科研处、社科处】及其他校园合作伙伴共享兴趣。由于机构本身的和公共的科学政策都对大学成果增长有兴趣,这将成为一个更重要的领域,图书馆将越来越多成为一个合作伙伴。对于机构数字资料将如何更全面地管理,与研究者身份清晰连接,研究信息管理是这个慢慢兴起视角的一部分。

【结论】
无论研究信息管理在美国是否成为一个新的服务类型,如我已经在这儿讨论过的方式,很明显,它所提出的问题,将为图书馆提供重要机会,进一步参与支持大学的研究生活。

“2014高校图书馆发展论坛”记录

前几天在西安参加“2014高校图书馆发展论坛”,会议主题“数字资源——用数据量体 为学科裁衣”。两天时间中,主会场、分会场共43个报告,可以看出两大热点,各占约1/3:
一是机构知识库(9个+科学数据管理1个)与开放获取(4个)
二是数据统计分析(13个+数字资源违规使用防控1个)

对于机构知识库,自己一直在旁观,总觉得要做一个不只是图书馆一厢情愿、自娱自乐的东西不容易:目的是什么?能做到什么程度?起到什么作用?此次由于时间冲突,只能选听几个报告:
1、平台方面,开幕式上知先的广告确实吸引眼球。一方面,在资料入库上,能够自动抓取机构成果、自动检测代表性成果、生成引用报告;另一方面,在用户服务上,个人成果一键上传、自动发送引用通知,还具有团队知识库,可以一键分享(钱建立:让机构知识库从“庙堂”演化为“书房”)。理念不错,功能实现到何程度,有待考察。
西安交大的系统也是由图书馆提需求、厂商开发,实现与外部数据共享与推送(张雪蕾:机构知识库与外部数据共享集成)。
相对而言,比较“亲民”的是北邮的,参加Calis三期机构知识库项目,对DSpace进行各种本地化改造,强化个性化功能(颉夏青:社交推荐,让机构知识库“活”起来)。这位MM的PPT也做得相当好。
2、设计本地政策方面,以下3个报告可参考:潘卫:中国机构知识库用户调查及思考;张冬荣:机构知识库内容存缴的激励机制与措施;顾立平:科学数据管理与数据资源建设中的权益问题与解决方案
3、开放获取方面,北大图书馆开始进入学术出版领域(周义刚:北京大学期刊网的建设与思考)。

自己对数据统计分析也有兴趣。近年本馆在做纸本资源利用统计,电子资源方面馆内使用统计只是采用厂商提供数据,无法做到按使用者统计。本次同样由于时间冲突,也只能选听几个报告:
1、数字资源利用统计方面,西交大和复旦的以前略有了解,这次就没打算听。没料到的是,只听了清华的,就觉得没必要再了解如何做了——以清华的实力,在做了9年之后打算购买商业软件……(邹荣:数字资源访问管理系统的实践与思考)。[update 2014-6-1] 西安交大邵晶副馆长在某分会场提问环节中称,国外数据库提供的利用统计数据与他们统计结果差别不大(10%左右),但有的国内数据库厂商提供的数据要差数倍,应该是没有遵循COUNTER标准。
2、统计管理方面,上交大报告,我打算推荐给本馆负责统计工作的同事(徐璟:图书馆业务数据统计与管理优化实践
3、altmetrics概念还很新,EBSCO已经收购了做网络研究影响分析的Plum Analytics(刚查了新闻发布是2014.1.15),“引用数据是滞后指标”,而网络影响才是即时的。匹兹堡大学机构知识库已经用上了PlumX:D-Scholarship@Pitt(刚又查到:PlumX被Library Journal评为2013年度Most Ambitious Database,其中称2位创建人领导团队开发了Summons,有意思)。据称EBSCO正利用altmetric提高学术结果排序,这对它的发现系统EDS是好消息么?(公丕俭:使用传统与网络计量,即时有效促进学术对话与交流)。
4、RFID,越来越多土豪馆开始采用。在纸本利用逐年下降的情势下,我对其必要性一直存疑。华中师大申请了一项利用RFID收集现刊利用数据的专利(实用新型)——如此才能体现RFID不同于条码的优越性(李玉海:基于用户行为数据的馆藏资源配置与利用评估模型)。
5、最后给本馆的报告做下广告(李欣:数据挖掘助力服务创新

本人的报告属于其他1/3难以归类之列,主要介绍RDA的进展与现状,题为:RDA:从内容标准到元数据标准
(大部分报告应该会在会议网站上挂出,有需求者可耐心等待)
[update 2014-6-10] PPT已经挂出,标明不公开的有14个,占三分之一,其中程焕文馆长没有PPT。数据统计分析的报告绝大部分不公开;比较意外的是分论坛六“国家、教育部课题汇报”,五个中竟然有三个不公开。
[update 2015-4-16]程焕文馆长报告见《图书馆论坛》2015年第4期第1-8页:在“纸张崇拜”与“数字拥戴”之间——高校图书馆信息资源建设的困境与出路

[update 2014-6-1]会议相关报道
2014年中国高校图书馆发展论坛隆重开幕
分论坛一:校企精英献策图书馆数字资源发展规划
分论坛二:百家争鸣机构知识库建设
分论坛三:“数字资源监控”报告集锦
分论坛四:图书馆数据挖掘、数字资源组织建设经验分享
对本人报告的介绍:“……从元数据标准类型切入,介绍了RDA发展进程、内容标准和元数据标准。以美国RDA实施进程为例举例说明,简单介绍了大陆RDA采用情况。随后分享了RDA如何从内容标准转变为元数据标准。介绍了2014年1月发布的元数据元素的类和属性。交流了使用RDF三元组元素集例和RDA注册起到的取代MARC和其他数字图书馆应用的作用。”
分论坛五:“数字资源平台建设”主题报告集锦
分论坛六:聚焦课题汇报 服务学科教研
闭幕式报告:朱强馆长:图书馆的数字化转型已经开始,但远未完成
“头脑风暴 资源为王”2014高校图书馆发展论坛闭幕

DuraSpace发布开源云服务DuraCloud

DuraSpace于11月1日正式发布开源云服务DuraCloud,项目部分受美国国会图书馆的全国数字信息基础设施与保存项目(NDIIPP)资助。
介绍显示(What is DuraSpace),其背后使用三家云服务商──Amazon Web Services, Windows Azure, RockSpace。
DuraSpace项目开源,但提供基于订购的服务。有三种不同价格的服务计划(Pricing):
1、基本存档与保存(年费$4500):免费存储量500GB,不可增加
2、基本媒体访问(年费$4500):免费存储量500GB,不可增加
3、专业(年费$7000):免费存储量1000GB,增加费用$1.00/GB/年
第1种的功能:联机备份与同步,Web访问,文件格式识别,标签,访问多个存储云,通过Web上下载内容,联机共享,文件健康检查。
第2种在第1种基础上增加功能:流媒体,图像浏览,图像转换
第3种在第2种基础上增加功能:在多个云服务商处联机备份与同步

目前已有麻省理工学院、哥伦比亚大学、西北大学和莱斯大学签约使用其托管的云服务以保护数字资源。但尚未见到上线产品,也没有演示。可以申请试用帐户(Trial Account Request),需参加在线培训课程,每月有限额,估计不易申请。

———-背景———-
2009年5月,两大开源机构库软件Fedora和DSpace合并成立DuraSpace,提出云产品DuraCloud(http://duraspace.org/duracloud.php):
向学术图书馆、大学及其他文化遗产机构提供其数字内容的永久访问服务
存储交由专业存储提供者
DuraSpace提供确保长期访问和便利使用的功能,包括:
· 访问 access
· 保存 preservation
· 再用 re-use
· 云内容分享 sharing of cloud content

2009年7月,美国国会图书馆与DuraSpace合作进行为期一年的试验,使用云技术永久访问数字内容。其他参与机构有纽约公共图书馆和生物多样性遗产图书馆。未注意结果如何。

———-消息的分割线———-
Via Library Technology Guide: DuraSpace launches open-source cloud service (November 1, 2011)
官方消息(November 1, 2011)
DuraSpace Launches Open-Source Cloud Service
 会议上的介绍(October 18, 2011)
DuraSpace Offers Open-Source Cloud Service for Academia
正式发布前于10月19日在EDUCAUSE会议上的报告《使用云存档与保存学术记录:来自DuraCloud试验项目的经验》(Using the Cloud to Archive and Preserve the Scholarly Record: Experiences from the DuraCloud Pilot)

———-参见———-
“云计算与图书馆”会议参会记 (2009年9月25日)之:云计算@图书馆 (PPT, p.23-24)

圖書館觀點:Fedora + DSpace = DuraSpace (15th May 2009)

News from the Library of Congress: Library of Congress and DuraCloud Launch Pilot Program Using Cloud Technologies to Test Perpetual Access to Digital Content (July 14, 2009)
译介:美国国会图书馆和DuraCloud发起试验计划——利用云技术进行数字内容永久存取的情况