纽约公共图书馆数字画廊

    纽约公共图书馆最近开通了数字画廊NYPL Digital Gallery。这个图像数据库现有27万5千幅图像,提供免费、开放的联机访问。图像源自其四个研究图书馆的原生珍本馆藏,有绘画、手稿、地图、照片、海报、珍本插图书等,包括应用科学、社会科学、历史、美术和表演艺术。
    画廊的入选准则如下,不知对我们在数字化工作中选择资源有否启示:

  •  
    • 公众有较高需求
    • 独特或非常珍贵,日常使用易受损
    • 笨重或易碎的古器物
    • 本馆认定的重要馆藏
    • 有价值然而不为人所知的重要收藏

    图片查看方式有搜索与浏览。浏览有四个途径:

  • 专题画廊gallery collections:艺术与文学、城市与建筑、文化与社会、历史与地理、工业与技术、自然与科学、印刷与图像,共7个画廊
  • 名称字顺names:艺术家、作者、出版者、收藏者等,共5千多个名称
  • 主题字顺subjects:取自LCSH和LC图像资料叙词表LC Thesaurus for Graphic Materials的人名、机构名、地名和论题,共2万3千多个主题。
  • 图书馆libraries:人文与社会科学馆、表演艺术馆、黑人文化研究中心及科学、产业和商业馆,NYPL的4所研究图书馆


    浏览途径多多,但如果列表中能标明所收图片数量就更有参考价值。显示的每幅图有小、中、大三个尽寸,可直接保存。还有详细的书目信息,包括图像标题、出处、资料类别、主题、馆藏地等,能用于参考与引用。

    随意搜索浏览一下,研究古代名人资料丰富,如与教皇Sixtus五世有关的资料。研究近现代中国资料也不少,有古老的中国地图,还有“中国美人”香烟牌(各类香烟牌共有2万余幅,最能反映时代风情?)。图书馆方面,有各类图书馆图书馆建筑,还有80多年前图书馆编目部的场景。

    2002年NYPL发布联机图片馆藏The NYPL Picture Collection Online(简称PCO),收录的是中曼哈顿图书馆的收藏,包括图书、报刊中的图像及照片、印刷品和明信片,共3万张,曾被评为2004年最佳免费参考网站。以新的NYPL研究图书馆的数字画廊的规模与质量,应当是2005年最佳免费参考网站的热门竞争者。

友情提示:最好选择美国人睡觉的时候访问,不然速度奇慢。

 

ISBN-13正式登场

    2005年1月1日,谋划已久的13位ISBN的转换进程正式开始。2年后,ISBN-13将完全取代10位的ISBN。其实多年前正式出版的图书上,条码位置已同时印有ISBN和ISBN-13,只是当时以978开头的13位的数字是作为图书的商品编号,而非书号。
    与编目有关的问题是:什么时候开始著录?著录在什么字段?图书馆编目系统的相应升级是否已经完成或至少放到了议事日程?

    美国国会图书馆启动最早,计划2004年10月1日就开始处理ISBN-13。到2007年1月1日前的转换过渡时期,将同时著录出版商提供的同一文献的两个ISBN号(10位和13位)。2007年后将只著录ISBN-13。
    在2004年6月的美国图书馆协会ALA年会上,机读书目信息委员会MARBI曾经讨论过MARC 21著录时是重复020的$a子字段,还是重复020字段。报道没有说明讨论的具体内容,推测重复子字段的理由应当是,因为对应的是同一装祯形式的多个号码;重复字段的理由应当是MARC 21定义中020$a不可重复。考虑到多家图书馆管理系统实现上的问题,LC最终采用重复020字段的方法。著录顺序是13位的在前,10位的在后。OCLC由于系统原因,暂时采用024字段(其它标准号),而未来仍将采用020字段。


    CNMARC方面,国家图书馆编《新版中国机读目录格式使用手册》(北京图书馆出版社,2004年)采用新的073字段(国际论文号)著录ISBN-13(第46页)。这就意味着未来的”国际标准书号”将不著录在国际标准书号(020)字段中,而著录在国际论文号(073)字段中。国家图书馆在编手册时(2003年上半年)就了解到了”ISBN书号谋划升位“之事,仍做出这种规定有点不可思议。

    编目员更关心对自己工作的影响。其实ISBN-13就号码而言,目前与ISBN的差别只是在ISBN前加上978,以及最后1位校验位不同。校验位本来就是由机器自动生成,所以著录时没有理由让编目员输入两次,而应当由软件自动由10位的ISBN转换成ISBN-13,或者反之。OCLC目前在下载记录时,会自动把以978开头的ISBN-13转换为10位数字的ISBN。
    国内CALIS联合目录也在考虑更新相关软件,以能够顺利处理13位的ISBN号。目前各图书馆自动化管理系统的编目模块,编目时会进行ISBN号码自动校验,ISBN-13会被视为错误的ISBN而作出提示或自动改为$z子字段。不知道各图书馆自动化管理系统对此准备得如何?

更新(2005年5月24日):
    不列颠图书馆同样于2004年10月1日起处理ISBN-13。见:The British Library and 13-digit ISBNs

 

数字化《四库全书》

    看到”中美百万册数字图书馆项目”China-America Digital Academic Library (CADAL)的数字化资源中,包括《四库全书》。先引一段《文汇读书周报》最近一篇对《四库全书》的评论如下:

    上个世纪八十年代,研究生还不像现在这般满地都是的时候,台湾商务印书馆影印的《文渊阁四库全书》,出现在学校图书馆书架上,很是让做文史题目的老少学生开心了一阵,没别的,只是因为看古籍方便了。但那时但凡学过一点版本学的,也都知道《四库》本名声不佳。所以论文要出版时,总免不了为校勘版本折腾一阵子,把原来为图方便用《四库》本的地方,统统用比较像样版本校勘替换过。目的只有一个,就是非到万不得已,尽量别在注释、参考文献里出现《四库》本的字样,以免被内行人看了,落下”这老兄用的全是《四库》本”的话柄。

    对《四库全书》的非议以前也听说过一些,但从没想过这些非议意味着什么。看了上文,才明白四库本在内行眼中的地位。
    去年出版文津阁本时曾引起争议,但接下来文澜阁本又将出版,文溯阁本如果不是有归属争议,恐怕出版之事也列入议事日程了。CADAL已经将《四库全书》扫描完成(或许只选择了部分?),不知用的是何本?

    听参与CADAL的某单位领导开玩笑般说过,Google数字化图书计划公布,”百万册”可以少一半了――美国的50万册可以不用做了。文渊阁本已有电子版,以现在的出版方式,在印刷版售完后,未来文津阁本、文澜阁本出版电子版似乎也是顺理成章(水到渠成、举手之劳)的事。为何CADAL又参与一次《四库全书》的数字化?
    我不懂古籍,但从在编图书中,经常看到点校古籍时选本的用心与讲究。反观CADAL中”传统文化资源”部分,似乎在意的只是尽快完成相应的数量。从扫描《四库全书》,可以想象对各项目单位古籍书目的汇总”去重”工作,恐怕也只能看看篇目,无法考证版本的。

    或许没什么可非议的,只是时移世易罢了。再引《文汇读书周报》那篇文章后面一段:

           正所谓三十年河东,三十年河西。二十年后的今天,文史专业研究生的论文里,《四库》本铺天盖地;新派教授的大著中,也不乏以征引《四库》本为荣者。那架势,颇有乾隆皇帝看得,我咋就不能用得的无边豪气。

参考:
陈海英,竺海康:中美百万册数字图书馆项目综述(《大学图书馆学报》2005年第1期第3-6,13页)
阿寅:看不懂的《四库全书》热(《文汇读书周报》2005年2月25日第3版)