2014中国图书馆年会笔记(附推国家典籍博物馆)

前几天在北京开会,先参加10-11日的中国图书馆年会学术会议,11日下午在第19分会场“知识组织揭示”有一个发言;13日参加“资源描述”国家标准的工作会议。

原未打算参加年会开幕式,因而10日中午才到京。不巧长假末身体出了点意外,所幸未影响出行,只是不能久坐。为保证完整参加第19分会场,整个学术会议其他部分只听了半场开放获取主题论坛,是历年开会中最不投入的一次了。

———-(主题论坛)开放获取:图书馆的挑战与机遇 ———-
关注OA多年,总觉得我国政策层面没有足够支持,因而一直有置身事外的感觉。前一阵北大期刊网上线,只把它当作图书馆进入出版的事例,未往OA上想。听了此次OA主题论坛,倒是有一点紧迫感了。政策面也在向好,2012温家宝、2014李克强分别表示支持OA,社科自科基金对资助项目OA也有了各自规定,感觉现在不应该再驻足观望了。

1、张晓林:学术信息开放获取的趋势和对图书馆机制的挑战
讲到OA最大障碍是图书馆。这个我倒没有感觉到,似乎图书馆一直很无私地支持OA。但OA本质上是减少中间环节,图书馆作为中介机构,确实会受到不小的影响。报告最后说:0A需要图书馆、图书馆更需要OA。

2、曾燕:研究型图书馆开放获取战略与实践
介绍中科院文献情报中心绿色OA+金色OA并重的实践。首次听说该中心对若干OA刊取得折扣,中科院作者由该中心资助50%出版费的做法。

3、聂华:高校开放获取机构知识库建设与服务
介绍了国内外高校图书馆的IR实践,国内的一些做法如与科研处合作存缴论著、收集课程相关资源,在IR中引入替代计量分析工具等,都是可以借鉴的。数量方面:北大机构成果元数据回溯约40万条;农大18万元数据,原文11万;清华1万多学者;厦大与汤森路透合作批量申请ID,批导入数据等。
另CALIS的IR建设与推广项目名为Chair,CALIS机构知识库网站http://ir.calis.edu.cn/未见此名,之前也不知道,可见自己关注太少。查到聂馆长2012年的一个PPT:CHAIR: CALIS机构知识库 建设与推广,反思与展望

4、郝继英:研究机构开放获取机构知识库实践
谈到一些提供增值服务的内容,如可视化等。中科院文献情报中心以机构排行推进中科院机构支持IR,也是很值得借鉴的做法。刚查了下,该IR全名为:中国科学院机构知识库服务网格

———-(第19分会场)知识组织揭示:技术、方法与实践 ———-
本分会场报告较多涉及语义网,且都或多或少结合实际应用。而我的报告恰恰略掉了BIBFRAME序列化部分,且相对务虚,夹在整场报告中自觉有点不和谐。

1、孙坦:语义环境下知识组织问题的几点思考
内容较多,听得有点走神。其中说到本体的必要性,知识抽取等等。

2、胡小菁:BIBFRAME:模型与词表(slideshare上传出错,稍后更新[update 2015-10-25上传完成])
BIBFRAME作为一个关联数据模型,包括BF模型、BF词表、BF模型序列化和支持工具4个部分,因时间所限,只涉及前2个部分。

3、孙辉:国史知识库构建与语义检索
以三元组方式建设中华人民共和国史知识库。提供“国史百科”,可用自然语言检索(识别不同模式),可视化结果展示,链接来源与详细信息,可发现人物关系,等等。未查到网址,很期待实际使用。
历史最有意思的是不同来源信息可能不一致,哪怕是权威文件。因而会后向孙老师询问如果不同来源信息冲突如何处理,答案是目前涉及的都是基本没有争议的内容,由专家人工判断择一。

4、王乐春:一“页”一菩提
由不同网站(百度、calis、cadal、国科图、nstl等)检索结果页面入手,介绍国图资源梳理整合而成的“文津搜索”。

5、乔晓东:汉语科技词系统建设与应用
介绍已经开发多年的汉语科技词系统:细化传统词表关系,根据W3C对词系统(Vocabularies)的定义,属于简化的本体。作为轻量级本体,定义了20种关系、16种属性。
已发布5个重点领域词系统,可以多种格式导出(数据库、RDF、OWL);并发布有移动知识服务应用。
比较特别的是提供一个开放平台,可注册后自建领域本体。

6、真溱:知识图谱:知识组织工程化的新思路
介绍以图层叠加方式,按知识图层、资源图层实现可视化展示。
其中提到横向关联、纵向索引,没有完全理解。

7、钱庆:KOS在医学信息挖掘与处理中的利用
介绍了很多医学词表、本体及工具,以及在机器辅助标引、智能检索方面的实践。

8、张智雄:STKOS概念关系的可视化揭示方法研究与实现
介绍STKOS(科技知识组织体系共享服务系统)的可视化展示。感觉与前面知识图谱报告类似,因为有多个维度(定义了6种关系),一个图例展示不可行。看网站,目前术语也均在医学领域。

———-推荐:国家典籍博物馆———-
开会常去北京,却总是来去匆匆。此次两会之间隔着一个休息天,有时间玩了一天。上午重游故宫、下午二小时参观国家图书馆新建的国家典籍博物馆。上下午的参观内容还有小小的呼应:上午到了养心殿旁那个小小的三希堂,下午看到了三希堂法帖;上午到了文渊阁,下午看了四库全书及永乐大典——第一次看到永乐大典,开本真大。
参观典籍博物馆后的感叹是:国图好东西太多!博物馆共9个主题展馆,实物丰富,背景与配套图片解释详尽,相关知识整理给参观者提供很好指导。辅以透明触摸屏、体感设备、电脑游戏互动及其他时新技术的应用,可以说相当精彩。二小时参观只是蜻蜓点水,细细看看、玩玩,一天时间不多。

“2014高校图书馆发展论坛”记录

前几天在西安参加“2014高校图书馆发展论坛”,会议主题“数字资源——用数据量体 为学科裁衣”。两天时间中,主会场、分会场共43个报告,可以看出两大热点,各占约1/3:
一是机构知识库(9个+科学数据管理1个)与开放获取(4个)
二是数据统计分析(13个+数字资源违规使用防控1个)

对于机构知识库,自己一直在旁观,总觉得要做一个不只是图书馆一厢情愿、自娱自乐的东西不容易:目的是什么?能做到什么程度?起到什么作用?此次由于时间冲突,只能选听几个报告:
1、平台方面,开幕式上知先的广告确实吸引眼球。一方面,在资料入库上,能够自动抓取机构成果、自动检测代表性成果、生成引用报告;另一方面,在用户服务上,个人成果一键上传、自动发送引用通知,还具有团队知识库,可以一键分享(钱建立:让机构知识库从“庙堂”演化为“书房”)。理念不错,功能实现到何程度,有待考察。
西安交大的系统也是由图书馆提需求、厂商开发,实现与外部数据共享与推送(张雪蕾:机构知识库与外部数据共享集成)。
相对而言,比较“亲民”的是北邮的,参加Calis三期机构知识库项目,对DSpace进行各种本地化改造,强化个性化功能(颉夏青:社交推荐,让机构知识库“活”起来)。这位MM的PPT也做得相当好。
2、设计本地政策方面,以下3个报告可参考:潘卫:中国机构知识库用户调查及思考;张冬荣:机构知识库内容存缴的激励机制与措施;顾立平:科学数据管理与数据资源建设中的权益问题与解决方案
3、开放获取方面,北大图书馆开始进入学术出版领域(周义刚:北京大学期刊网的建设与思考)。

自己对数据统计分析也有兴趣。近年本馆在做纸本资源利用统计,电子资源方面馆内使用统计只是采用厂商提供数据,无法做到按使用者统计。本次同样由于时间冲突,也只能选听几个报告:
1、数字资源利用统计方面,西交大和复旦的以前略有了解,这次就没打算听。没料到的是,只听了清华的,就觉得没必要再了解如何做了——以清华的实力,在做了9年之后打算购买商业软件……(邹荣:数字资源访问管理系统的实践与思考)。[update 2014-6-1] 西安交大邵晶副馆长在某分会场提问环节中称,国外数据库提供的利用统计数据与他们统计结果差别不大(10%左右),但有的国内数据库厂商提供的数据要差数倍,应该是没有遵循COUNTER标准。
2、统计管理方面,上交大报告,我打算推荐给本馆负责统计工作的同事(徐璟:图书馆业务数据统计与管理优化实践
3、altmetrics概念还很新,EBSCO已经收购了做网络研究影响分析的Plum Analytics(刚查了新闻发布是2014.1.15),“引用数据是滞后指标”,而网络影响才是即时的。匹兹堡大学机构知识库已经用上了PlumX:D-Scholarship@Pitt(刚又查到:PlumX被Library Journal评为2013年度Most Ambitious Database,其中称2位创建人领导团队开发了Summons,有意思)。据称EBSCO正利用altmetric提高学术结果排序,这对它的发现系统EDS是好消息么?(公丕俭:使用传统与网络计量,即时有效促进学术对话与交流)。
4、RFID,越来越多土豪馆开始采用。在纸本利用逐年下降的情势下,我对其必要性一直存疑。华中师大申请了一项利用RFID收集现刊利用数据的专利(实用新型)——如此才能体现RFID不同于条码的优越性(李玉海:基于用户行为数据的馆藏资源配置与利用评估模型)。
5、最后给本馆的报告做下广告(李欣:数据挖掘助力服务创新

本人的报告属于其他1/3难以归类之列,主要介绍RDA的进展与现状,题为:RDA:从内容标准到元数据标准
(大部分报告应该会在会议网站上挂出,有需求者可耐心等待)
[update 2014-6-10] PPT已经挂出,标明不公开的有14个,占三分之一,其中程焕文馆长没有PPT。数据统计分析的报告绝大部分不公开;比较意外的是分论坛六“国家、教育部课题汇报”,五个中竟然有三个不公开。
[update 2015-4-16]程焕文馆长报告见《图书馆论坛》2015年第4期第1-8页:在“纸张崇拜”与“数字拥戴”之间——高校图书馆信息资源建设的困境与出路

[update 2014-6-1]会议相关报道
2014年中国高校图书馆发展论坛隆重开幕
分论坛一:校企精英献策图书馆数字资源发展规划
分论坛二:百家争鸣机构知识库建设
分论坛三:“数字资源监控”报告集锦
分论坛四:图书馆数据挖掘、数字资源组织建设经验分享
对本人报告的介绍:“……从元数据标准类型切入,介绍了RDA发展进程、内容标准和元数据标准。以美国RDA实施进程为例举例说明,简单介绍了大陆RDA采用情况。随后分享了RDA如何从内容标准转变为元数据标准。介绍了2014年1月发布的元数据元素的类和属性。交流了使用RDF三元组元素集例和RDA注册起到的取代MARC和其他数字图书馆应用的作用。”
分论坛五:“数字资源平台建设”主题报告集锦
分论坛六:聚焦课题汇报 服务学科教研
闭幕式报告:朱强馆长:图书馆的数字化转型已经开始,但远未完成
“头脑风暴 资源为王”2014高校图书馆发展论坛闭幕

大学图书馆的一种死法

Bibliographic Wilderness(博主Jonathan Rochkind,霍普金斯大学图书馆)继续之前“大学图书馆生存危机”的话题(参见:大学图书馆生存危机?——2012美国高校教师调查),预测大学图书馆的一种死法。
在他的前一博文下,Eric Hellman推荐了一篇新近的文章:
Open Access, library and publisher competition, and the evolution of general commerce, by Andrew Odlyzko, 2013(36页PDF文件)
文章作者来自明尼苏达大学数学学院,出处不明,在arXiv.org上显示2013年2月5日提交(http://arxiv.org/abs/1302.1105),归类在“计算机科学——数字图书馆”。文章分析美国研究图书馆协会成员(ARL)的期刊馆藏1990-2010年的情况,参考咨询量1995-2010年急剧下降情况……。文章太长,没有仔细看其中开放获取部分。只细看了结论:
学术出版最重要的发展正悄悄地进行,两个主要中介机构(图书馆和出版社)的传统作用正在萎缩。但新的机会是开放的,逼迫这两个机构起新的作用,也引入新的代理机构(如Google),谁执行什么功能是开放竞争的,此时此刻,出版社比图书馆做得好。这种情况是否会继续,新的代理机构的什么作用正与这些功能竞争,还难以预测。但是,出版社通过常被批评的大宗打包交易(“Big Deal” packages),为学术信息提供了更好的获取。”

Jonathan看上文后又发出长篇评论。他的看法是:“对于互联网及信息环境改变会导致图书馆死亡的话题已经谈了十多年了,有些人可能觉得这只是令人厌烦的危言耸听。但是我认为,现在我们实际上正看着它发生。“
我认为大学图书馆一个极其可能的死亡场景是,我们的主管机构[大学]简单地直接为服务向供应商——不管是出版社、集成商还是其他更新的‘颠覆性’商业机构——付钱,既为内容及及存储与组织平台,也为检索的“发现”服务,只需要一个本地的基干人员处理许可问题。如果图书馆的大块经费只是简单地为大宗打包交易向供应商付钱,只需极少专业人员,完全不需要很大的图书馆组织只是简单地做图书保管与订购。”

这使我想起开博一年时所写的博文:慢慢地消亡:不只是编目(2005年9月30日),其中提到“如果再加上彻底解决商业数据库使用的支付技术与体制问题,或者大家都采用“开放存取”了,谁还要通过图书馆获取文献全文?
以及两年多前第一次听张甲老师说PDA时的第一反应:“这种模式是不是意味着图书馆专业性的进一步丧失?”(参见:PDA:电子图书的用户驱动采购,2010年12月14日)
目前电子资源的使用数据几乎全部由供应商掌握,在大数据环境下,根据使用直接结算已经完全可能。当越来越多的资源以数字化方式使用,图书馆这个中介还有存在价值吗?同样由供应商掌控的“发现服务”显然挽救不了图书馆。
美国一些研究性大学早已在转型比如数字出版,那是一条自救之路吗?

见:Bibliographic Wilderness
One scenario for the death of the academic library (2013-5-26) (有墙)
Academic library existence at risk? (2013-5-22) (有墙)