数字化《四库全书》

    看到”中美百万册数字图书馆项目”China-America Digital Academic Library (CADAL)的数字化资源中,包括《四库全书》。先引一段《文汇读书周报》最近一篇对《四库全书》的评论如下:

    上个世纪八十年代,研究生还不像现在这般满地都是的时候,台湾商务印书馆影印的《文渊阁四库全书》,出现在学校图书馆书架上,很是让做文史题目的老少学生开心了一阵,没别的,只是因为看古籍方便了。但那时但凡学过一点版本学的,也都知道《四库》本名声不佳。所以论文要出版时,总免不了为校勘版本折腾一阵子,把原来为图方便用《四库》本的地方,统统用比较像样版本校勘替换过。目的只有一个,就是非到万不得已,尽量别在注释、参考文献里出现《四库》本的字样,以免被内行人看了,落下”这老兄用的全是《四库》本”的话柄。

    对《四库全书》的非议以前也听说过一些,但从没想过这些非议意味着什么。看了上文,才明白四库本在内行眼中的地位。
    去年出版文津阁本时曾引起争议,但接下来文澜阁本又将出版,文溯阁本如果不是有归属争议,恐怕出版之事也列入议事日程了。CADAL已经将《四库全书》扫描完成(或许只选择了部分?),不知用的是何本?

    听参与CADAL的某单位领导开玩笑般说过,Google数字化图书计划公布,”百万册”可以少一半了――美国的50万册可以不用做了。文渊阁本已有电子版,以现在的出版方式,在印刷版售完后,未来文津阁本、文澜阁本出版电子版似乎也是顺理成章(水到渠成、举手之劳)的事。为何CADAL又参与一次《四库全书》的数字化?
    我不懂古籍,但从在编图书中,经常看到点校古籍时选本的用心与讲究。反观CADAL中”传统文化资源”部分,似乎在意的只是尽快完成相应的数量。从扫描《四库全书》,可以想象对各项目单位古籍书目的汇总”去重”工作,恐怕也只能看看篇目,无法考证版本的。

    或许没什么可非议的,只是时移世易罢了。再引《文汇读书周报》那篇文章后面一段:

           正所谓三十年河东,三十年河西。二十年后的今天,文史专业研究生的论文里,《四库》本铺天盖地;新派教授的大著中,也不乏以征引《四库》本为荣者。那架势,颇有乾隆皇帝看得,我咋就不能用得的无边豪气。

参考:
陈海英,竺海康:中美百万册数字图书馆项目综述(《大学图书馆学报》2005年第1期第3-6,13页)
阿寅:看不懂的《四库全书》热(《文汇读书周报》2005年2月25日第3版)

 

浏览器插件方便用户利用图书馆

    去年末Google宣布与五大图书馆合作数字化图书时,我曾引美国研究图书馆协会执行总裁Duane Webster的话:”人们很急切想知道研究人员,学者和市民是否能被逐渐引导到使用免费公共资源还是宁愿向出版商掏钱买书”。并认为,”如果读者宁愿选择花钱让网上书店送书到家,而不是费一番周折免费到图书馆借书,那么,这就不是图书数字化的问题了,而是图书馆服务的问题了。”
    昨天看到一则报道,Harris County Public Library Creates Toolbar for Online Customers,美国休斯顿的哈里斯县公共图书馆已经行动起来,吸引网络用户在上网时方便地利用图书馆,方法是免费提供一个插件,安装成网络浏览器的一个工具条,有IE和Firefox二种版本。安装后浏览器显示如下:


    用户在上网时看到图书或电影时,可使用该工具条查找图书馆目录并预约,随后用户可以到邻近的分馆去取。该工具条还有一些链接,可用于续借、阅读与撰写书评、看本馆流行新书与DVD一览表、搜索Google与亚马逊等。据称提供这种插件在美国公共图书馆中是首家。去年底,俄亥俄州的Toledo大学已经推出了适用于Mozilla/Firefox浏览器的检索OPAC插件,可用于Innovative公司的Millenium或 INNOPAC系统 。
    哈里斯县公共图书馆有26个分馆,去年流通量为8百多万册。这个数字至少在我看来是相当惊人的――2002年我国各级公共图书馆的年外借量为2亿,折合下来每馆仅区区数万。用我们的话说,”成绩的取得”,想来应该与他们想尽办法吸引读者有莫大关系。

 

红绿灯RedLightGreen

    美国研究图书馆集团RLG经过数年研究与试验,于2004年正式发布RedLightGreen(缩写也是RLG),完全在Web上开放自己的联合目录数据库(目前仅包括图书),而不是仅限图书馆员使用的专用软件或telnet方式访问。
    RLG是与OCLC并称的大型学术图书馆、档案馆、博物馆联合体,其联合目录有400种语言的记录共4千5百多万条。联系到OCLC将其联合目录WorldCat数据提供给Google和Yahoo!等搜索引擎提供利用,并且对图书馆参与Open WorldCat设置很高的门槛,看来开放联合目录、吸引网络时代读者利用馆藏已是一种趋势。我们的联合目录何时跟进?

    RedLightGreen现在有100多图书馆链接,人气还不算太高。据称检索结果列表依搜索词的相关度排序,同时还基于复本数,便于使用者在自己的图书馆中找到想找的书――或许对于其主要目标用户大学生而言,很多时候只需有关某方面内容的图书,复本量多,借到的可能性就高?
    从其检索结果来看,RedLightGreen不是简单的OPAC,特点总结如下:

1、除结果列表外,还根据检索结果提供有关的主题、作者、语言链接。或者说,用户可由自然语言检索转向受控语言;对于不熟悉这一领域的用户,还可得知此领域的著名或高产作者。比如输入information retrieval,提供的第一、五位作者是兰开斯特(看来规范控制有待加强?)。再点击”更多作者”,大概可以把各国有关作者一网打尽了,比如有高崇谦、王永成(中文)、丸山昭二郎(日文)等。

2、本馆书目查询,看任意指定图书馆有无此文献(我国仅有清华大学加入此联合目录)。与Open WorldCat通过Google提供的”图书馆搜索”功能类似。

3、提供需要的参考文献格式(MLA, Chicago, Turabian, APA),注册用户可以选择输出标准格式的引文,方便不熟悉学术规范的大学生们。实现简单,却又很实用的一个创意?
我注册了一下,输出的某书MLA参考文献格式如下:
Berkman, Robert I. Find it fast: how to uncover expert information on any subject. 4th ed. New York: HarperPerennial, 1997.

4、相关结果有网上书店(亚马逊)查询,有时还会有Google关于本书的搜索结果。有点一站式检索的意思。

5、同一作品只提供一条检索结果,其他的版本以如”4 editions”的方式提供链接,看来是采用了FRBR模型。

6、同时提供包括CJK、阿拉伯语在内的非西方语言检索。OCLC计划于2005年7月1日将整个WorldCat纳入Open WorldCat,但西文之外的检索功能尚不在其近期计划之内???
    在RedLightGreen查”中国“,看上去结果不错,繁、简体中文甚至日文的结果都有。
    不过有时结果就有点怪,比如查”情报“,第一条结果是India and Tibet。详细书目记录中既没有汉字,也没有information或类似对应的词,不知道结果从何而来。