数字化《四库全书》

    看到”中美百万册数字图书馆项目”China-America Digital Academic Library (CADAL)的数字化资源中,包括《四库全书》。先引一段《文汇读书周报》最近一篇对《四库全书》的评论如下:

    上个世纪八十年代,研究生还不像现在这般满地都是的时候,台湾商务印书馆影印的《文渊阁四库全书》,出现在学校图书馆书架上,很是让做文史题目的老少学生开心了一阵,没别的,只是因为看古籍方便了。但那时但凡学过一点版本学的,也都知道《四库》本名声不佳。所以论文要出版时,总免不了为校勘版本折腾一阵子,把原来为图方便用《四库》本的地方,统统用比较像样版本校勘替换过。目的只有一个,就是非到万不得已,尽量别在注释、参考文献里出现《四库》本的字样,以免被内行人看了,落下”这老兄用的全是《四库》本”的话柄。

    对《四库全书》的非议以前也听说过一些,但从没想过这些非议意味着什么。看了上文,才明白四库本在内行眼中的地位。
    去年出版文津阁本时曾引起争议,但接下来文澜阁本又将出版,文溯阁本如果不是有归属争议,恐怕出版之事也列入议事日程了。CADAL已经将《四库全书》扫描完成(或许只选择了部分?),不知用的是何本?

    听参与CADAL的某单位领导开玩笑般说过,Google数字化图书计划公布,”百万册”可以少一半了――美国的50万册可以不用做了。文渊阁本已有电子版,以现在的出版方式,在印刷版售完后,未来文津阁本、文澜阁本出版电子版似乎也是顺理成章(水到渠成、举手之劳)的事。为何CADAL又参与一次《四库全书》的数字化?
    我不懂古籍,但从在编图书中,经常看到点校古籍时选本的用心与讲究。反观CADAL中”传统文化资源”部分,似乎在意的只是尽快完成相应的数量。从扫描《四库全书》,可以想象对各项目单位古籍书目的汇总”去重”工作,恐怕也只能看看篇目,无法考证版本的。

    或许没什么可非议的,只是时移世易罢了。再引《文汇读书周报》那篇文章后面一段:

           正所谓三十年河东,三十年河西。二十年后的今天,文史专业研究生的论文里,《四库》本铺天盖地;新派教授的大著中,也不乏以征引《四库》本为荣者。那架势,颇有乾隆皇帝看得,我咋就不能用得的无边豪气。

参考:
陈海英,竺海康:中美百万册数字图书馆项目综述(《大学图书馆学报》2005年第1期第3-6,13页)
阿寅:看不懂的《四库全书》热(《文汇读书周报》2005年2月25日第3版)

 

OCLC软件竞赛

    OCLC正主办一场面向个人的非商业软件竞赛,鼓励创新使用OCLC的基于WEB的图书馆服务。奖励包括2500美元现金,加上访问OCLC总部的来回机票+4天住宿费用,所编软件还有可能被OCLC的图书馆服务所采用――看上去是不是很诱人?
    要求参赛者编写一个程序,提供一个工作原型,通过使用至少一项OCLC提供的服务,实现对WorldCat数据的”有趣”或”创新”的应用。为此OCLC提供取自WorldCat的一组书目记录以及OCLC的ResearchWorks (各种新技术的实验室)和Terminology Services(多种在线词表服务)的部分服务,参赛者也可以使用Open WorldCat。
    评判标准是:
        对图书馆有价值(30%):程序能在多在程序上改善OCLC成员的服务或降低其费用。
        使用OCLC服务或数据(30%):程序如何加强OCLC改善对成员服务的能力。
        原创(20%):观念是否新颖?是现有系统的再实现,还是完全创新的?
        结构与设计清晰(20%):代码是否易理解,可否与其他系统互用,能否扩展其服务,能否合成到更大的系统中。
    比赛日期为2005年1月31日至5月15日。详细信息见:OCLC Research Software Contest

    中科院文献情报中心的mj已经行动起来参与此事了。他的设计对我来说犹如天书,只看到他有使用Google Scholar的设想,推测他使用的OCLC服务应该是Open WordCat。
    可参见我的:”Google Scholar将取代引文索引?“和”OCLC的Open WorldCat计划“。

 

Google数字化图书将终结传统图书馆?

    很奇怪为什么我们中间不少人看到Google大规模数字化图书,会联想到图书馆的式微乃至消亡?如果说Google威胁着图书馆,那并不是因为它数字化图书,而是因为人们对网络搜索的强烈依赖。
    由于网络的发展,上网找资料已经成为人们的习惯,在发达国家与地区读者到馆率持续走低。《文汇读书周报》2004年12月17日首版的报道说,《上海城市读书状况调查报告》显示,网上搜索已经成为读者查找书籍的主要途径,占受访者43.6%,几乎是直接在图书馆查找的一倍(22.4%)(”纽约等图书馆与Google联手打造网上图书馆”)。国外很多人甚至认为,网上查不到的内容就是不存在的(People think if it&aposs not on the Internet, it doesn&apost exist)。
    此次几大图书馆参与馆藏的数字化,用《纽约时报》的话说,就是图书馆”终于不再为这个趋势而怨天尤人,转而去寻求弥合两者的办法”(”Google阴影下的图书馆业“)。或者说,”反映了图书馆也在努力适应数字世界中自我角色的转变”(”Google可能引发公共图书馆商业革命“)。通过信息推送重塑图书馆形象,让读者了解图书馆的丰富收藏,吸引读者利用图书馆提供的服务,应当是美英图书馆此次参与Google数字化图书的初衷。


    其实图书馆界一向堪称利用计算机及网络技术的先锋,也很早就把各自的馆藏放到了OPAC上。无奈习惯了一站式检索的潜在读者,现在已经没有兴趣一家家走访图书馆网站。即使OCLC开放WorldCAT,也未必能招来多少搜索客。如何让读者重新走向图书馆?OCLC的Open WorldCAT计划将其书目数据送给Google和Yahoo!,在我看来就是为了满足用户的一站式搜索习惯,是”网络时代图书馆的一种推广、营销活动,是促进用户到馆、扩大印刷图书利用的一种手段。”
    人们担心的是读者已经如此依赖网络,如果图书都可在网上看到全文,岂不更无须利用图书馆?然而,网上并不能看到所有图书,因为Google只在网上提供过了版权保护期图书的全文。大量利用率更高的、有版权保护的图书只提供目次等介绍性信息,以及少量的页面浏览。如果要看全部,Google会有二种链接,一是网上书店,一是图书馆。
    美国研究图书馆协会执行总裁Duane Webster说,”人们很急切想知道研究人员,学者和市民是否能被逐渐引导到使用免费公共资源还是宁愿向出版商掏钱买书”(”Google可能引发公共图书馆商业革命“)。
    是啊,如果读者宁愿选择花钱让网上书店送书到家,而不是费一番周折免费到图书馆借书,那么,这就不是图书数字化的问题了,而是图书馆服务的问题了。