“2014高校图书馆发展论坛”记录

前几天在西安参加“2014高校图书馆发展论坛”,会议主题“数字资源——用数据量体 为学科裁衣”。两天时间中,主会场、分会场共43个报告,可以看出两大热点,各占约1/3:
一是机构知识库(9个+科学数据管理1个)与开放获取(4个)
二是数据统计分析(13个+数字资源违规使用防控1个)

对于机构知识库,自己一直在旁观,总觉得要做一个不只是图书馆一厢情愿、自娱自乐的东西不容易:目的是什么?能做到什么程度?起到什么作用?此次由于时间冲突,只能选听几个报告:
1、平台方面,开幕式上知先的广告确实吸引眼球。一方面,在资料入库上,能够自动抓取机构成果、自动检测代表性成果、生成引用报告;另一方面,在用户服务上,个人成果一键上传、自动发送引用通知,还具有团队知识库,可以一键分享(钱建立:让机构知识库从“庙堂”演化为“书房”)。理念不错,功能实现到何程度,有待考察。
西安交大的系统也是由图书馆提需求、厂商开发,实现与外部数据共享与推送(张雪蕾:机构知识库与外部数据共享集成)。
相对而言,比较“亲民”的是北邮的,参加Calis三期机构知识库项目,对DSpace进行各种本地化改造,强化个性化功能(颉夏青:社交推荐,让机构知识库“活”起来)。这位MM的PPT也做得相当好。
2、设计本地政策方面,以下3个报告可参考:潘卫:中国机构知识库用户调查及思考;张冬荣:机构知识库内容存缴的激励机制与措施;顾立平:科学数据管理与数据资源建设中的权益问题与解决方案
3、开放获取方面,北大图书馆开始进入学术出版领域(周义刚:北京大学期刊网的建设与思考)。

自己对数据统计分析也有兴趣。近年本馆在做纸本资源利用统计,电子资源方面馆内使用统计只是采用厂商提供数据,无法做到按使用者统计。本次同样由于时间冲突,也只能选听几个报告:
1、数字资源利用统计方面,西交大和复旦的以前略有了解,这次就没打算听。没料到的是,只听了清华的,就觉得没必要再了解如何做了——以清华的实力,在做了9年之后打算购买商业软件……(邹荣:数字资源访问管理系统的实践与思考)。[update 2014-6-1] 西安交大邵晶副馆长在某分会场提问环节中称,国外数据库提供的利用统计数据与他们统计结果差别不大(10%左右),但有的国内数据库厂商提供的数据要差数倍,应该是没有遵循COUNTER标准。
2、统计管理方面,上交大报告,我打算推荐给本馆负责统计工作的同事(徐璟:图书馆业务数据统计与管理优化实践
3、altmetrics概念还很新,EBSCO已经收购了做网络研究影响分析的Plum Analytics(刚查了新闻发布是2014.1.15),“引用数据是滞后指标”,而网络影响才是即时的。匹兹堡大学机构知识库已经用上了PlumX:D-Scholarship@Pitt(刚又查到:PlumX被Library Journal评为2013年度Most Ambitious Database,其中称2位创建人领导团队开发了Summons,有意思)。据称EBSCO正利用altmetric提高学术结果排序,这对它的发现系统EDS是好消息么?(公丕俭:使用传统与网络计量,即时有效促进学术对话与交流)。
4、RFID,越来越多土豪馆开始采用。在纸本利用逐年下降的情势下,我对其必要性一直存疑。华中师大申请了一项利用RFID收集现刊利用数据的专利(实用新型)——如此才能体现RFID不同于条码的优越性(李玉海:基于用户行为数据的馆藏资源配置与利用评估模型)。
5、最后给本馆的报告做下广告(李欣:数据挖掘助力服务创新

本人的报告属于其他1/3难以归类之列,主要介绍RDA的进展与现状,题为:RDA:从内容标准到元数据标准
(大部分报告应该会在会议网站上挂出,有需求者可耐心等待)
[update 2014-6-10] PPT已经挂出,标明不公开的有14个,占三分之一,其中程焕文馆长没有PPT。数据统计分析的报告绝大部分不公开;比较意外的是分论坛六“国家、教育部课题汇报”,五个中竟然有三个不公开。
[update 2015-4-16]程焕文馆长报告见《图书馆论坛》2015年第4期第1-8页:在“纸张崇拜”与“数字拥戴”之间——高校图书馆信息资源建设的困境与出路

[update 2014-6-1]会议相关报道
2014年中国高校图书馆发展论坛隆重开幕
分论坛一:校企精英献策图书馆数字资源发展规划
分论坛二:百家争鸣机构知识库建设
分论坛三:“数字资源监控”报告集锦
分论坛四:图书馆数据挖掘、数字资源组织建设经验分享
对本人报告的介绍:“……从元数据标准类型切入,介绍了RDA发展进程、内容标准和元数据标准。以美国RDA实施进程为例举例说明,简单介绍了大陆RDA采用情况。随后分享了RDA如何从内容标准转变为元数据标准。介绍了2014年1月发布的元数据元素的类和属性。交流了使用RDF三元组元素集例和RDA注册起到的取代MARC和其他数字图书馆应用的作用。”
分论坛五:“数字资源平台建设”主题报告集锦
分论坛六:聚焦课题汇报 服务学科教研
闭幕式报告:朱强馆长:图书馆的数字化转型已经开始,但远未完成
“头脑风暴 资源为王”2014高校图书馆发展论坛闭幕

OpenDOAR的机构库统计

    已经有好几年,一直觉得机构库已是明日黄花,虽然看着数量不少,但库规模大的不多。最近因种种原因,又重新拾起来看。
    开放存取库名录(OpenDOAR)是了解总体情况的很好入口。网站首页突出显示目前收录超过1800家。曾记下2006年2月5日时为324家,看统计图,2006年以后似乎发展势头很好,一直在平稳向上。

查找
可以按主题领域内容类别(文章、图书、会议、数据集、学习对象、多媒体、专利、参考资源、软件、特殊、学位论文、未出版)、库类型(集合、学科、政府、机构)、国家语种软件6种途径交叉查询,每种在查询下拉框中都标明了数量。
按库类型,属于机构库的为1481个

√ 库内容搜索:采用Google定制搜索,而非OAI收割。试下来查不到结果,难道都拒绝Google机器人访问?

√ 库列表:按洲别、国家浏览。方便了解各大洲、各国情况。

统计
可以组合出各种统计图表,缺省的是世界范围的。
OpenDOAR统计一览
    从收录条数看,超过5万的有36个库(2%),其中很多不是机构库,如首位的ERIC(130万条)、第3位的PubMed Central(80万条)、第5位的arXiv(60万多条);也有一些应该是大学机构库,如排名14的英国剑桥大学DSpace@Cambridge(19万多条)、排名19的比利时根特大学学术书目与机构档案(12万条)。
在所有1815个库中,收录1万条以上的共184个库(10%)、5千条以上的共315个库(17%)、1千条以上的共771个库(42%)、5百条以上的共987个库(54%)──不到5百条的611个库(占1/3),还有216个库没有标明收录条数。

———-机构库软件———-
    机构库软件是DSpace(665)一家独大(超过1/3),Eprints(297)其次(近1/6),其后依次是Digital Commons(79),OPUS(54),余下都不超过30,Greenstone(24)第6位,听说过的还有ContentDM(17),Fedora(16),DigiTool(15),竟然还有WordPress(1)。

    最近常被推荐Drupal,有4家采用。查了下,加拿大爱德华王子岛大学的IslandScholar是规模最大的(10142条),说明是Drupal+Fedora,没有OAI-PMH网址。
    IslandScholar看内容是典型的大学机构库。有简单的技术说明(Technical Components),抄录如下:
1. Fedora (ver 2.2.4)
* Lucene – Indexing/searching
* MySQL – Database
* Mulgara – Resource Index
* XACML – Security
2. RuleEngine Framework – Rules for conversion processes
* OpenOffice conversion engine
* Searchable PDF
3. Drupal – ver 5.12
* igital Repository Module
** OpenSource module for connectivity  to FEDORA
** developed by UPEI
* Faculty Authentication with UPEI Credentials
** LDAP Module
* Book Module – Automatic Book menu generation
* Path Module – renaming of URL’s
* SpamSpam Module – obfuscates email addresses
* Printer Friendly Pages
4. Discovery/acquisition of Published Copy
* Sherpa/Romeo -auto-connects to display publisher permissions info for articles
* COINS support
** LibX UPEI Edition
* OpenURL
5. Refworks
* Compiling Collections
* Data Cleanup
* Creation of XML for import into FEDORA.
6. Programming Languages used
* PHP
* XML
* Java
* JavaScript
7. Operating System/Hardware
* SLEZ 10
* Dell PowerEdge
** Dual Quad Core CPU’s
** 16GB RAM

———-链接———-
从数字看开放存取(Open access) (2006-2-8)

中美数图研讨班(4)·机构库,看起来很美 (2007年5月27日)

知道你已经在做机构库了吗——摘评一份详尽的IR调查报告 (2007年5月28日)

国际机构库调查出版 (2007年11月14日)

台湾机构典藏(TAIR) (2008年7月25日)

香港大学投千万建“全民共享”学术库 (2010年06月07日)

OCLC成员报告:2010图书馆现状

今年的OCLC成员报告出炉:How Libraries Stack Up: 2010。与往年的长篇大论不同,本报告只有10张统计图,通过不同来源的数字,以可视化的图形,与其他公共与私营机构的数据做对比,彰显图书馆在经济、社会及文化诸方面的作用。
可以说每张图都很吸引眼球,无论是内容还是表现形式。不好意思全贴在这里,就最后三张了:
OCLC Membership Report 2010

提供2页的PDF版(有彩色版634K与黑白打印版295K)和11页的PPT版(有与PDF一致的完整版3.96M及模板版2.54M──供各图书馆填进自己的数字)。
我们的图书馆拿得出这样漂亮的数据吗?

via Tennant: Digital Libraries: The Power of Excellent Visualization (June 19th, 2010)
趁机再加上Roy Tennant引用的第3张

[update 2010-06-22] 最近遗漏东西比较多,感谢tsingove提醒,图林中文译站已有中文版:成就突出的美国公共图书馆 (12 六月 2010)