存档在 ‘乱花迷眼’ 分类

纽约公共图书馆数字画廊

2005年3月5日

    纽约公共图书馆最近开通了数字画廊NYPL Digital Gallery。这个图像数据库现有27万5千幅图像,提供免费、开放的联机访问。图像源自其四个研究图书馆的原生珍本馆藏,有绘画、手稿、地图、照片、海报、珍本插图书等,包括应用科学、社会科学、历史、美术和表演艺术。
    画廊的入选准则如下,不知对我们在数字化工作中选择资源有否启示:

  •  
    • 公众有较高需求
    • 独特或非常珍贵,日常使用易受损
    • 笨重或易碎的古器物
    • 本馆认定的重要馆藏
    • 有价值然而不为人所知的重要收藏

    图片查看方式有搜索与浏览。浏览有四个途径:

  • 专题画廊gallery collections:艺术与文学、城市与建筑、文化与社会、历史与地理、工业与技术、自然与科学、印刷与图像,共7个画廊
  • 名称字顺names:艺术家、作者、出版者、收藏者等,共5千多个名称
  • 主题字顺subjects:取自LCSH和LC图像资料叙词表LC Thesaurus for Graphic Materials的人名、机构名、地名和论题,共2万3千多个主题。
  • 图书馆libraries:人文与社会科学馆、表演艺术馆、黑人文化研究中心及科学、产业和商业馆,NYPL的4所研究图书馆


    浏览途径多多,但如果列表中能标明所收图片数量就更有参考价值。显示的每幅图有小、中、大三个尽寸,可直接保存。还有详细的书目信息,包括图像标题、出处、资料类别、主题、馆藏地等,能用于参考与引用。

    随意搜索浏览一下,研究古代名人资料丰富,如与教皇Sixtus五世有关的资料。研究近现代中国资料也不少,有古老的中国地图,还有“中国美人”香烟牌(各类香烟牌共有2万余幅,最能反映时代风情?)。图书馆方面,有各类图书馆图书馆建筑,还有80多年前图书馆编目部的场景。

    2002年NYPL发布联机图片馆藏The NYPL Picture Collection Online(简称PCO),收录的是中曼哈顿图书馆的收藏,包括图书、报刊中的图像及照片、印刷品和明信片,共3万张,曾被评为2004年最佳免费参考网站。以新的NYPL研究图书馆的数字画廊的规模与质量,应当是2005年最佳免费参考网站的热门竞争者。

友情提示:最好选择美国人睡觉的时候访问,不然速度奇慢。

 

数字化《四库全书》

2005年3月2日

    看到”中美百万册数字图书馆项目”China-America Digital Academic Library (CADAL)的数字化资源中,包括《四库全书》。先引一段《文汇读书周报》最近一篇对《四库全书》的评论如下:

    上个世纪八十年代,研究生还不像现在这般满地都是的时候,台湾商务印书馆影印的《文渊阁四库全书》,出现在学校图书馆书架上,很是让做文史题目的老少学生开心了一阵,没别的,只是因为看古籍方便了。但那时但凡学过一点版本学的,也都知道《四库》本名声不佳。所以论文要出版时,总免不了为校勘版本折腾一阵子,把原来为图方便用《四库》本的地方,统统用比较像样版本校勘替换过。目的只有一个,就是非到万不得已,尽量别在注释、参考文献里出现《四库》本的字样,以免被内行人看了,落下”这老兄用的全是《四库》本”的话柄。

    对《四库全书》的非议以前也听说过一些,但从没想过这些非议意味着什么。看了上文,才明白四库本在内行眼中的地位。
    去年出版文津阁本时曾引起争议,但接下来文澜阁本又将出版,文溯阁本如果不是有归属争议,恐怕出版之事也列入议事日程了。CADAL已经将《四库全书》扫描完成(或许只选择了部分?),不知用的是何本?

    听参与CADAL的某单位领导开玩笑般说过,Google数字化图书计划公布,”百万册”可以少一半了――美国的50万册可以不用做了。文渊阁本已有电子版,以现在的出版方式,在印刷版售完后,未来文津阁本、文澜阁本出版电子版似乎也是顺理成章(水到渠成、举手之劳)的事。为何CADAL又参与一次《四库全书》的数字化?
    我不懂古籍,但从在编图书中,经常看到点校古籍时选本的用心与讲究。反观CADAL中”传统文化资源”部分,似乎在意的只是尽快完成相应的数量。从扫描《四库全书》,可以想象对各项目单位古籍书目的汇总”去重”工作,恐怕也只能看看篇目,无法考证版本的。

    或许没什么可非议的,只是时移世易罢了。再引《文汇读书周报》那篇文章后面一段:

           正所谓三十年河东,三十年河西。二十年后的今天,文史专业研究生的论文里,《四库》本铺天盖地;新派教授的大著中,也不乏以征引《四库》本为荣者。那架势,颇有乾隆皇帝看得,我咋就不能用得的无边豪气。

参考:
陈海英,竺海康:中美百万册数字图书馆项目综述(《大学图书馆学报》2005年第1期第3-6,13页)
阿寅:看不懂的《四库全书》热(《文汇读书周报》2005年2月25日第3版)

 

OCLC软件竞赛

2005年2月5日

    OCLC正主办一场面向个人的非商业软件竞赛,鼓励创新使用OCLC的基于WEB的图书馆服务。奖励包括2500美元现金,加上访问OCLC总部的来回机票+4天住宿费用,所编软件还有可能被OCLC的图书馆服务所采用――看上去是不是很诱人?
    要求参赛者编写一个程序,提供一个工作原型,通过使用至少一项OCLC提供的服务,实现对WorldCat数据的”有趣”或”创新”的应用。为此OCLC提供取自WorldCat的一组书目记录以及OCLC的ResearchWorks (各种新技术的实验室)和Terminology Services(多种在线词表服务)的部分服务,参赛者也可以使用Open WorldCat。
    评判标准是:
        对图书馆有价值(30%):程序能在多在程序上改善OCLC成员的服务或降低其费用。
        使用OCLC服务或数据(30%):程序如何加强OCLC改善对成员服务的能力。
        原创(20%):观念是否新颖?是现有系统的再实现,还是完全创新的?
        结构与设计清晰(20%):代码是否易理解,可否与其他系统互用,能否扩展其服务,能否合成到更大的系统中。
    比赛日期为2005年1月31日至5月15日。详细信息见:OCLC Research Software Contest

    中科院文献情报中心的mj已经行动起来参与此事了。他的设计对我来说犹如天书,只看到他有使用Google Scholar的设想,推测他使用的OCLC服务应该是Open WordCat。
    可参见我的:”Google Scholar将取代引文索引?“和”OCLC的Open WorldCat计划“。

 

Google数字化图书将终结传统图书馆?

2004年12月18日

    很奇怪为什么我们中间不少人看到Google大规模数字化图书,会联想到图书馆的式微乃至消亡?如果说Google威胁着图书馆,那并不是因为它数字化图书,而是因为人们对网络搜索的强烈依赖。
    由于网络的发展,上网找资料已经成为人们的习惯,在发达国家与地区读者到馆率持续走低。《文汇读书周报》2004年12月17日首版的报道说,《上海城市读书状况调查报告》显示,网上搜索已经成为读者查找书籍的主要途径,占受访者43.6%,几乎是直接在图书馆查找的一倍(22.4%)(”纽约等图书馆与Google联手打造网上图书馆”)。国外很多人甚至认为,网上查不到的内容就是不存在的(People think if it&aposs not on the Internet, it doesn&apost exist)。
    此次几大图书馆参与馆藏的数字化,用《纽约时报》的话说,就是图书馆”终于不再为这个趋势而怨天尤人,转而去寻求弥合两者的办法”(”Google阴影下的图书馆业“)。或者说,”反映了图书馆也在努力适应数字世界中自我角色的转变”(”Google可能引发公共图书馆商业革命“)。通过信息推送重塑图书馆形象,让读者了解图书馆的丰富收藏,吸引读者利用图书馆提供的服务,应当是美英图书馆此次参与Google数字化图书的初衷。


    其实图书馆界一向堪称利用计算机及网络技术的先锋,也很早就把各自的馆藏放到了OPAC上。无奈习惯了一站式检索的潜在读者,现在已经没有兴趣一家家走访图书馆网站。即使OCLC开放WorldCAT,也未必能招来多少搜索客。如何让读者重新走向图书馆?OCLC的Open WorldCAT计划将其书目数据送给Google和Yahoo!,在我看来就是为了满足用户的一站式搜索习惯,是”网络时代图书馆的一种推广、营销活动,是促进用户到馆、扩大印刷图书利用的一种手段。”
    人们担心的是读者已经如此依赖网络,如果图书都可在网上看到全文,岂不更无须利用图书馆?然而,网上并不能看到所有图书,因为Google只在网上提供过了版权保护期图书的全文。大量利用率更高的、有版权保护的图书只提供目次等介绍性信息,以及少量的页面浏览。如果要看全部,Google会有二种链接,一是网上书店,一是图书馆。
    美国研究图书馆协会执行总裁Duane Webster说,”人们很急切想知道研究人员,学者和市民是否能被逐渐引导到使用免费公共资源还是宁愿向出版商掏钱买书”(”Google可能引发公共图书馆商业革命“)。
    是啊,如果读者宁愿选择花钱让网上书店送书到家,而不是费一番周折免费到图书馆借书,那么,这就不是图书数字化的问题了,而是图书馆服务的问题了。

 

Google Print:读者、图书馆、出版社、书商皆大欢喜

2004年12月15日

      Google宣布与美英数家大图书馆合作数字化图书馆馆藏,成为昨天的一大新闻。Google将自己的这项计划称之为”Google出借图书馆藏书”Google checks out Library Books,是早先开始的Google Print (Beta) 的一部分,在此之前Google Print主要面向出版社,由出版社提供图书。
      与Google Scholar有独立的检索界面不同,Google Print与Google Web使用同一检索界面,现有多少图书不得而知,我只在输入Google所举例子时才见到过检索结果中”Book results for …”和这个标记。此次Google计划在今后数年中扫描数百万册图书,使得这些图书信息可以通过互联网检索。
      毛军提到了版权问题。事实上,Google Print最早的合作者正是出版商,如果没有解决版权问题,出版商如何愿意合作?读者在网上看到的是图书页面的扫描图像,文字不可复制,但可以保存网页。过版权保护的图书可以看全文。在版权保护期内的图书,只能看书目信息和少量页面。如果想看全书,可以选择去网上书店购买,或者去图书馆借阅(均提供相应链接)。

      Google Print无疑将是多赢的――读者、图书馆、出版商、书商,当然还有Google:

 

      读者在网上找书,可以在网上看到过了版权保护期的图书,了解什么书商处有卖想要的书(通过”Buy this book”链接书商),什么图书馆有此书出借(通过”Library Search”链接查图书馆?);
      参与图书馆可以借此不花分文数字化自己的馆藏,其他图书馆也可通过更多的外借增加图书利用率和读者到馆率;
      同样不花分文,图书信息被更多潜在客户知悉,出版社、书商可以卖掉更多的书,出版商还有如下所述的额外收益;
      那么Google得到了什么呢?它通过检索者点击网页上与图书内容相关的广告获得收益(这些收益与该图书的出版社分享),同时,实现其”组织世界信息、使之被广泛获取与使用”的目标。

      随着Google的不断壮大,开始有人担心它会成为第二个微软。偏偏Google在上市申请书中承诺”不要变得邪恶”,反而引来Google邪恶说。但Google至今的每一步都让人感到”君子爱财,取之有道”。比如在面向研究人员的Google Scholar中不做广告;比如在Google Print的FAQ中,提示避免注意少儿不宜内容。
      Google在简洁的外表下提供高质量的检索结果,不断提供丰富的内容,所以我喜欢Google。然而,如同我同时去几家超市购物以免一家独大后的垄断,我也希望它的竞争对手们做强做大。