乱谈图书馆自动化系统

    前些日子看到有个老外讲起图书馆自动化系统(ILS),把Innovative (III)
的Millennium归入“外包”的系统,初看有点出乎意料,转而想想也有点道理。当年选系统的时候,自动化部特别希望买这个系统,理由是系统由公司远程管理,有问题只要找公司解决就行,自己不用管,省心。“省心”也是有代价的,那就是连系统日志都看不到。某次发现系统中有一批记录更新出问题,想找出谁做的,向公司提出请求,正遇上圣诞假期,过后没及时催,紧接着学校放假,等开学了再找公司,时间已过,信息已经查不到了。
   
不管什么系统,无论系统理员是不是省心,使用的部门一样会头大。有人说Google聪明,上线几年的应用,仍然挂着beta,摆明出错是正常的,试用版嘛。当然Google是免费的,出错可以原谅。但事实上花费不菲买来的商业ILS,每次升级也会出现各种各样的问题,大概也是正常的(要不为什么某使用
Horizon的图书馆轻易不愿升级),并且也不得不“原谅”。不过,像III这样,每年收大把的维护费,要做些维护的事,比如使用培训,比如重新做一次索引,还要另外收费,就很不可思议了。
   
最不可原谅的,是Millennium系统的汉字是永远的alpha版,这么多年没什么长进(或者因转到Unicode而更糟?),永远不清楚即将进入系统的字会变成什么模样——虽然问题字符应该不到1%,也足够让人头痛。2000年在HKIEd,她们就在很认真地抓同一个汉字进入系统呈现不一样代码而查不到的问题。后来香港用户协会一同做这件事,向公司提供了字符对应表──本来应该是公司做的事,竟然由用户承担,只能说是“骑虎难下”。不知道香港有了字符对应表,问题是否彻底解决。大陆地区从GB/GBK对应到
CCCII/EACC(现在是Unicode),用不上香港的表,用户又各自为阵,据说某馆竟然有十个人处理乱码问题。按一般逻辑,买来的系统应该是可用的,保证进入系统的字符正确理所应当,并且每年还在付维护费,如果已经进入系统的字符出问题,公司负责改正也是理所应当──不幸事实却是,由于码表不全、字符对应错误,进入系统字符出错是每天都在发生的事,需要用户发现后逐个向公司提出,并且同一个字符更改正确后,保不准过些日子又出问题;而所有已经进入系统的乱码都要用户自己来改。竟然有如此痛苦的“外包”!

   
曾经看到国外对多家图书馆自动化系统的用户调查,对Millennium的满意程度相当高,公司显然也很是引以为傲的。近些年有Geek对ILS公司不满,
在于公司不开放接口让用户开发自己的应用,从把Millennium看作外包来看,Millennium本来就是适用傻瓜型系统管理的(似乎是目前唯一一家不开放的大ILS公司),用户方面大概也很少自主开发的要求,因此就很满意?如果在中国做ILS调查,不知道结果会怎样。
   
认真想一想,虽然是用户调查,还真不知道调查表是什么人填的,馆长?系统部?业务部门?最终用户?恐怕结果会大相径庭的。同样地,图书馆打算更新系统前,
向谁了解系统情况?也是需要认真考虑的。一个完整的ILS,有很多的模块与功能,对各系统的功能与操作流程的综合平衡,才是最终决定因素(撇开价格因
素)。在各系统大多数功能相似的情况下,有时候,某个功能特别强大,会成为最终决定时很重要的砝码,但也不要忘了,如果某个功能特别弱,也是会被断然抛弃的。
   
前面说撇开价格因素,其实价格是开始圈定候选系统时首先考虑的因素。在设定价格范围内开始考察系统时,入选公司会向你展示最完美的系统,当觉得满意而有意向后,或许会“不经意中发现”,某些演示的功能没有包含在基本价格中──大价钱都已经接受了,再附加一点也可以承受吧,最终价格可能会因此悄悄地上调不少。十多年前我们选系统时,OPAC还不是一个受人关注的部分,好象没有什么人考虑读者如何使用,只考虑本部门要用的功能能否方便地实现。现在大家观念不同了,所以学网上有人说,可以上网去测试。只是一般人可能不知道实现同样的功能,在某些系统是含在基本价格中的,而有些系统则另有代价,比如显示封面图片,比如提供外部相关链接,比如2.0的OPAC界面。

[update] 2009-6-3 经多次努力,本馆Millennium字符问题终获解决。

张甲讲座:未来图书馆和图书馆系统

    下午到上图听张甲老师(中文介绍)讲座“未来图书馆和图书馆系统”。[update 2009-3-23: PPT]
    到上图后发现会场不大,大概因为消息发得太迟,估计到会人不会太多──可惜了Keven令人眼花缭乱的广告。好在最终会场差不多满座,当然其中上图馆员不少,坐我边上的PLMM想来就是草长莺飞童鞋了(我很自闭,不敢跟她打招呼)。

    先讲未来的图书馆系统,介绍开放图书馆环境项目(OLE),项目致力于设计一个以服务为主的下一代图书馆系统,形成一个有兴趣帮助建立开源图书馆系统的社区。对于未来图书馆系统的组成部分,总结为以下9点:
1、统一资源的管理:不以馆藏为中心的资源管理,包括印刷品,订购的电子期刊、电子图书,以及未订购的外部资源。
2、以服务为主的图书馆系统设计:不以馆员工作流程为中心的系统设计。在别人的平台上、用别人的软件、使用外部的资源、提供图书馆读者的服务(云计算)。
3、利用学校资金管理系统来实现图书馆采购功能。
4、多元化的元数据控制:非MARC为中心的。根据不同类型内容,采用不同的元数据标准。
5、全球性的书目数据制作共享:一书只需制作一次记录。广泛使用标示符号(ISBN、ISSN、OCLC控制号、DOI等),链接馆藏信息。
6、物业性的流通管理:实时流通状态及可选择的馆藏显示、图书快递系统。
7、地区性的藏书仓储建设:印刷型图书的仓储。
8、可分散独立使用的系统功能:在读者需要的时间和场所提供图书馆服务。可分别嵌入用户应用系统(API),与教学软件(courseware)、科研软件(e-scholarship)、读者的社会网络集成。
9、身份认证管理:本地或到访单位的使用控制。

   
接下来讲未来的图书馆。互联网发展对图书馆前景的影响──从互联网的演变(目前为第三阶段Phase
three),讲到多元化的数据资源与利用(80%以上服务于读者的资源来自网络),再讲到社会网络和互联网新生代。后面是有关图书馆的预测、对图书馆员的挑战、可能的解决方案,在前面部分多少已经涉及。
    自己对实例尤其感兴趣。其间的一个实例,介绍安娜堡地区图书馆(AADL)开发的GoldDiggr,一个帮助用户买收藏品的网络服务,先利用博物馆数据源(hoard.it
XML Feed)找到博物馆图片,通过Yahoo抽词API提供相关检索词由用户选择,再以此通过eBay
API到eBay上搜索相应物品及卖家。组装这样一个平台,使用的是免费的工具,开发成本就是2个IT人员、3次30分钟的会议、3个月中共计2天时间。不过,这与图书馆有什么关系吗?答案是:有用户需求。──或许以后图书馆就不再是图书馆了?
    关于纽约大都会博物馆Flickr的故事也是第一次听到:该馆照片上网后若干网友对某些图片的评论,显示其专业程度远超馆内专家。(在Flickr的The Commons上没有找到该馆)

     相信报告中很多观点是共同认可的,但也有一些国内的想法截然不同。有些是由于张甲老师对国内现状了解不足,如国内的SNS、如GFW相关,而更多的则是由于国内外的认知差距。
    如张甲老师谈到才开过的第二届数字图书馆与开放源码软件学术研讨会,一谈到DSpace开发就兴奋,还有很多谈论如何把网上资源下载到自己的服务器上,而本报告中则多次提到用别人的平台、别人的软件、使用外部的资源、提供专业的服务(介绍了一个代码网站:www.hotscripts.com)。
   
特别值得回味的是“一个图书馆贡献的越多,得到的也越多”──此点在国内断难得到认同。张甲提到北大拓片的例子,就极有代表性:如果把我们的特藏共享了,
那我们不就没有了(大意)。要知道这是中国最前端的大学图书馆!所以我们可以在网上看到很多国外图书馆的特藏,却很难看到国内的。
    其实上面两点有时是统一的。闭门二次开发DSpace这样的开源软件就不提了,单就想着把网上资源弄到自己的服务器上,就足以让大家害怕开放自己的资源了。

   
另外,张甲老师也是唱衰MARC的,并且之前讲到一事,可做例证:经济不景气,美国著名的私立学校布朗大学图书馆裁员7名──四位IT、三位编目员。前一
阵曾听说上海某跨国公司的IT部门裁员20%,现在图书馆的IT也被裁?后来回答提问时的解释:被裁的是服务器管理方面的,因为IT可以外包之故。那么编目员呢?没人提相关问题,或许是不言自明?

    报告总结的两个两句话值得回味:
网络即计算机 Network is a computer.
互联网变成了场地 Internet is a place

有远见无行动=白日做梦 Vision without action is day dream.
有行动无远见=如同噩梦 Action without vision is nightmare.

    白日梦总比噩梦好。那么,我们还是再看看,别急着行动? 😀

关于OLE (Open Library Environment) Project
开放图书馆环境致力于替代目前图书馆集成系统(ILS)的模式,目标是向开源图书馆系统的开发提供设计文件,指导未来图书馆系统的实施,影响目前ILS厂商的产品。

关于网络发展的三个阶段,PPT中引用Michael Nelson的图──灯泡、狗儿也上网,可见报道其在AAAS 2009
session的报告“The Grid, the Cloud, Sensor Nets, and the Future of
Computing”:
Opinion – Will there be a cloud of clouds?
那儿很正式地说图片引用征得Michael Nelson的允许,就不好意思贴在此了[update:还是做一个链接吧]

[update 2009-3-17] 张甲老师提供的关于视频数量剧增的视频:What is the Exaflood?

淘金(GoldDiggr相关:
博物馆数据源:hoard.it Prototype: Museum Data Feed
雅虎抽词API:Yahoo Term Extraction API
eBay API

[update 2009-3-23] 相关博文:
图情一线天:future library 学术讲座 (2009-03-16)
雨禅:
未来还有图书馆系统吗? (2009-03-17)
那是一件多么波澜壮阔的事情(2009-03-19)
读张甲博士的皮皮提有感(2009-03-20)
云海之上II:思考着的图书馆站在希望的田野上—未来图书馆和图书馆系统(2009-03-20) 

试查山西省图书馆的图创Interlib系统

    在沁县参加青树活动时,听山西省图书馆说计划明年就把所有县馆馆藏都纳入省馆的集成系统中,在我看来这是一项宏大的计划。当时正在身旁的台湾玄奘大学吕明珠老师告诉我,她看过山西省馆的OPAC,非常先进,酷似北卡州的系统,还有标签、点评──虽然可能由于宣传原因,还没什么读者用。这自然引起我的兴趣。
    访问山西图书馆集群管理系统,确认是广州图创公司的Interlib系统。试查感觉,总体上框架还不错,细节则尚需推敲(不适用Firefox)。截图在此

    检索入口略显繁杂,但检索结果一览确实像极北卡州立大学馆的界面,上部是用于缩小检索范围的分类分面(还可选择隐藏),左侧是其他分面分馆(为今后加入各县馆藏做准备)、主题著者出版日期文献类型语言种类分类。除出版日期按年份顺序排列外,其他均按命中数量排列。
    检索结果的排序选项匹配度(缺省)、出版日期主题词题名责任者索书号题名拼音的升序、降序排列。有检索结果的RSS订阅预留了图书封面的位置,但尚未配上。
    用缺省的“题名”试查“上海”,从结果看为任意一致(而非常见的前方一致),当属题名关键词检索。
    分别看出版日期排序和责任者排序的结果:
    出版日期排序应该没有用定长字段,而是直接采用了出版日期著录字段──由此按降序排列,第1条是民国77年(1998年)、第3条是“出版日期不详”,接下来都是推测的出版年(加方括号),到第31条才是最新的2008年,第36条2007年。这是软件系统的问题。还有书目记录的问题:期刊没有按连续出版物处理,而是每一装订本做单独的书目记录,并且没有著录出版日期,导致期刊都排在最后。
    责任者排序应该没有用检索字段,而是直接采用了责任说明,因此作者前按题名页照录的国别等连同括号一起用于排序,而不是从作者姓氏开始。并且以这种方式,应该只对第一个责任者有效。还有另一个排序规则问题,看着既非笔划,也非拼音,使用快典网(http://bm.kdd.cc/)试查几个汉字内码,估计是按unicode编码排序的,这种排序对用户而言基本是无意义的。
    估计题名也是依此法排序的,所以除题名排序外,还有题名拼音排序──而目前大多数系统的汉字排序都是拼音序。

    详细结果页,有读者总评(5个星的评级)、Tags(标签)、收藏读者书评功能。
    增加标签及收藏需要登录,据帮助(?图标)说明,如背景色为黄色的,表示本人已经给此书加过的标签。不知道标签能否用于检索。
    读者书评不知道入口在哪里,或许收藏后方可写书评?
    评级则不需要登录,并且一旦做出评价就不能更改──这出乎我的意料,在此需要郑重地向作者郑念致歉(该书译为“程念”),因为试功能,随手给她的《上海生死劫》打了个1星。幸亏每条书目记录有固定链接,刷新一下页面后,发现可以再次评价,作为补救再打个5星──由此读者总评是3星(共2票),也就是说,一个人可以做N次评价。是不是有点问题?
    详细结果页右侧有相关资源相关借阅(借阅此书的读者所借阅的其他相关图书)、相关主题。大约使用不久,相关借阅没有看到内容。只是相关主题也没有,倒是有点奇怪,不知道打算放什么内容。相关资源分别是以题名查询豆瓣WorldCat谷歌百度图书CNKI。用百度图书而没有用谷歌图书,有点不解。以《上海生死劫》为例,在谷歌图书上还可以看到片断,而点击百度图书的结果则是“很抱歉,您要访问的页面不存在”。
   
    OPAC分面显示、多种排序的结果,是让书目记录中的错误更多地展示出来,此次试查同样证实这一论断。不多言。

附1:
图创软件称其Interlib系统推出一年半,已有300家图书馆使用,其中有广东省馆(45家分馆)及黑龙江省馆(30个分馆),势头强劲啊。
其产品中还有“Internet托管平台”,正是数月前写“求助:寻找‘云计算’的图书馆自动化系统”(2008-10-14)中提到的那种:“若干年前,曾见过一个SaaS的图书馆自动化系统网站,有一些小型图书馆利用它的服务。不用买电脑、不用系统管理员,这个网站就是自己的自动化系统。”

附2:
山西省馆有一个“晋图论坛”,见到其中有一贴子“Interlib培训教程视频”,除各业务模块(采访、编目、流通、期刊、系统管理)视频外,还有其用户手册及培训教程。
论坛建于2007年12月,贴子不多,标题大致浏览一过,发现2008-04-29影子的“图林博客之最”,标明摘自2008年4月18日图书馆专刊的雨禅文(原出自“最…..的图林博客”(2008-01-20)),又让自己陶醉一把。

关于青树活动,参见:
云海之上II:
撒下青树的种子(一)(2009-02-06)
撒下青树的种子(二)(2009-02-14)

辅仁大学图书馆服务队 (2009-02-01)
图书馆读者犯罪动机与图书馆管理政策 (2009-02-09)