纽约公共图书馆数字画廊

    纽约公共图书馆最近开通了数字画廊NYPL Digital Gallery。这个图像数据库现有27万5千幅图像,提供免费、开放的联机访问。图像源自其四个研究图书馆的原生珍本馆藏,有绘画、手稿、地图、照片、海报、珍本插图书等,包括应用科学、社会科学、历史、美术和表演艺术。
    画廊的入选准则如下,不知对我们在数字化工作中选择资源有否启示:

  •  
    • 公众有较高需求
    • 独特或非常珍贵,日常使用易受损
    • 笨重或易碎的古器物
    • 本馆认定的重要馆藏
    • 有价值然而不为人所知的重要收藏

    图片查看方式有搜索与浏览。浏览有四个途径:

  • 专题画廊gallery collections:艺术与文学、城市与建筑、文化与社会、历史与地理、工业与技术、自然与科学、印刷与图像,共7个画廊
  • 名称字顺names:艺术家、作者、出版者、收藏者等,共5千多个名称
  • 主题字顺subjects:取自LCSH和LC图像资料叙词表LC Thesaurus for Graphic Materials的人名、机构名、地名和论题,共2万3千多个主题。
  • 图书馆libraries:人文与社会科学馆、表演艺术馆、黑人文化研究中心及科学、产业和商业馆,NYPL的4所研究图书馆


    浏览途径多多,但如果列表中能标明所收图片数量就更有参考价值。显示的每幅图有小、中、大三个尽寸,可直接保存。还有详细的书目信息,包括图像标题、出处、资料类别、主题、馆藏地等,能用于参考与引用。

    随意搜索浏览一下,研究古代名人资料丰富,如与教皇Sixtus五世有关的资料。研究近现代中国资料也不少,有古老的中国地图,还有“中国美人”香烟牌(各类香烟牌共有2万余幅,最能反映时代风情?)。图书馆方面,有各类图书馆图书馆建筑,还有80多年前图书馆编目部的场景。

    2002年NYPL发布联机图片馆藏The NYPL Picture Collection Online(简称PCO),收录的是中曼哈顿图书馆的收藏,包括图书、报刊中的图像及照片、印刷品和明信片,共3万张,曾被评为2004年最佳免费参考网站。以新的NYPL研究图书馆的数字画廊的规模与质量,应当是2005年最佳免费参考网站的热门竞争者。

友情提示:最好选择美国人睡觉的时候访问,不然速度奇慢。

 

数字化《四库全书》

    看到”中美百万册数字图书馆项目”China-America Digital Academic Library (CADAL)的数字化资源中,包括《四库全书》。先引一段《文汇读书周报》最近一篇对《四库全书》的评论如下:

    上个世纪八十年代,研究生还不像现在这般满地都是的时候,台湾商务印书馆影印的《文渊阁四库全书》,出现在学校图书馆书架上,很是让做文史题目的老少学生开心了一阵,没别的,只是因为看古籍方便了。但那时但凡学过一点版本学的,也都知道《四库》本名声不佳。所以论文要出版时,总免不了为校勘版本折腾一阵子,把原来为图方便用《四库》本的地方,统统用比较像样版本校勘替换过。目的只有一个,就是非到万不得已,尽量别在注释、参考文献里出现《四库》本的字样,以免被内行人看了,落下”这老兄用的全是《四库》本”的话柄。

    对《四库全书》的非议以前也听说过一些,但从没想过这些非议意味着什么。看了上文,才明白四库本在内行眼中的地位。
    去年出版文津阁本时曾引起争议,但接下来文澜阁本又将出版,文溯阁本如果不是有归属争议,恐怕出版之事也列入议事日程了。CADAL已经将《四库全书》扫描完成(或许只选择了部分?),不知用的是何本?

    听参与CADAL的某单位领导开玩笑般说过,Google数字化图书计划公布,”百万册”可以少一半了――美国的50万册可以不用做了。文渊阁本已有电子版,以现在的出版方式,在印刷版售完后,未来文津阁本、文澜阁本出版电子版似乎也是顺理成章(水到渠成、举手之劳)的事。为何CADAL又参与一次《四库全书》的数字化?
    我不懂古籍,但从在编图书中,经常看到点校古籍时选本的用心与讲究。反观CADAL中”传统文化资源”部分,似乎在意的只是尽快完成相应的数量。从扫描《四库全书》,可以想象对各项目单位古籍书目的汇总”去重”工作,恐怕也只能看看篇目,无法考证版本的。

    或许没什么可非议的,只是时移世易罢了。再引《文汇读书周报》那篇文章后面一段:

           正所谓三十年河东,三十年河西。二十年后的今天,文史专业研究生的论文里,《四库》本铺天盖地;新派教授的大著中,也不乏以征引《四库》本为荣者。那架势,颇有乾隆皇帝看得,我咋就不能用得的无边豪气。

参考:
陈海英,竺海康:中美百万册数字图书馆项目综述(《大学图书馆学报》2005年第1期第3-6,13页)
阿寅:看不懂的《四库全书》热(《文汇读书周报》2005年2月25日第3版)

 

OCLC软件竞赛

    OCLC正主办一场面向个人的非商业软件竞赛,鼓励创新使用OCLC的基于WEB的图书馆服务。奖励包括2500美元现金,加上访问OCLC总部的来回机票+4天住宿费用,所编软件还有可能被OCLC的图书馆服务所采用――看上去是不是很诱人?
    要求参赛者编写一个程序,提供一个工作原型,通过使用至少一项OCLC提供的服务,实现对WorldCat数据的”有趣”或”创新”的应用。为此OCLC提供取自WorldCat的一组书目记录以及OCLC的ResearchWorks (各种新技术的实验室)和Terminology Services(多种在线词表服务)的部分服务,参赛者也可以使用Open WorldCat。
    评判标准是:
        对图书馆有价值(30%):程序能在多在程序上改善OCLC成员的服务或降低其费用。
        使用OCLC服务或数据(30%):程序如何加强OCLC改善对成员服务的能力。
        原创(20%):观念是否新颖?是现有系统的再实现,还是完全创新的?
        结构与设计清晰(20%):代码是否易理解,可否与其他系统互用,能否扩展其服务,能否合成到更大的系统中。
    比赛日期为2005年1月31日至5月15日。详细信息见:OCLC Research Software Contest

    中科院文献情报中心的mj已经行动起来参与此事了。他的设计对我来说犹如天书,只看到他有使用Google Scholar的设想,推测他使用的OCLC服务应该是Open WordCat。
    可参见我的:”Google Scholar将取代引文索引?“和”OCLC的Open WorldCat计划“。