“百万图书”项目(CADAL)相关信息

    曾经写过一篇博文,批评百万图书项目“数字化《四库全书》”。不过自己现在想法改变了,因为在国内简称CADAL的百万图书项目,把古籍、民国书刊之类没有版权限制的文献都放在公网上,让大家共享。此等做法,在国家资助项目中似乎难得一见,是好事当然要“顶”。
    竹帛斋主作为CADAL成员馆的住持,“温柔地”批评管理中心,自然有他的道理。而对于我等非成员馆,不能看现代图书是很能理解的,违“法”的事哪个敢随便做?

    Karen Coyle在文章“Mass Digitization of Books”(Journal of Academic Librarianship, v. 32, n. 6, 预印本)中把百万册图书项目称为Large-scale Digitization,对应于Google Books那样不做筛选的Mass Digitization。文中称该项目为“卡内基·梅隆百万册图书”(Carnegie Mellon Million Book project):始于2001年,在中国、印度和埃及数字化图书。由于项目宣称长期目标是“以数字化形式抓取所有图书”(The primary long-term objective is to capture all books in digital format),Karen称其为当今mass digitization运动的先驱。目前百万册图书项目已与开放内容联盟(Open Content Alliance)合作,加入到mass digitization运动中。

相关资料链接:

2001年报告:百万图书数字图书馆项目
Reddy, Raj and Gloriana StClair. The Million Book Digital Library Project. Carnegie Mellon University. (December 1, 2001)
http://www.rr.cs.cmu.edu/mbdl.htm

百万图书项目常见问题
Frequently Asked Questions About the Million Book Project
http://www.library.cmu.edu/Libraries/MBP_FAQ.html
其中有截至2005年11月的图书扫描数据:印度17万,中国42万,埃及2万;其中英语13.5万;大部分为没有版权的,6万余有版权,其中英语约5.3万,印度语言7千。

卡内基·梅隆大学图书馆网站上链接的三个网站:
1、百万图书中国网站:寰宇图书馆(Universal Library) http://www.ulib.org.cn
是中科院研究生院的,有些项目初期的信息,没有图书
2、百万图书印度网站:印度数字图书馆 http://dli.iiit.ac.in
有截止到2005年4月8日的统计信息,共5.7万册。
3、百万图书美国网站:寰宇图书馆(Universal Library) http://www.ulib.org
没有相关统计数据。
后两者有全文,安装AlternaTIFF(http://alternatiff.com/)后即可浏览tiff页面和txt文本。
埃及呢?只听说CADAL成员馆到埃及开会,没见到埃及在百万册书中的相关链接。

中国网站最新信息、全文浏览尽在CADAL (China-American Digital Academic Library):高等学校中英文图书数字化国际合作计划(China-US Million Book Digital Library Project)
两个名称,真让人困惑啊,如果再加上那个寰宇图书馆(Universal Library),就更困惑了。
http://www.cadal.net
http://www.cadal.cn
http://www.cadal.zju.edu.cn(看全文需要下载DjVu插件)

介绍百万图书项目的论文:
陈海英,竺海康:中美百万册数字图书馆项目综述
《大学图书馆学报》2005年第1期第3-6,13页

从获奖看国外流行的开源软件

    这两天,国外图林博客最热闹的新闻,大概就是WPOpac于12月4日获得了梅隆信息协作奖(2006 MATC,Mellon Awards for Technology Collaboration)。Casey Bisson分别在自己的博客Maison Bisson (Woot! Woot!)与WPopac blog(Now It’s Really Official)上报料,接下来就是其他blogger的庆贺了。澳州的librariesinteract.info上的报道“Could this blog be your next OPAC?”比较详细,值得一看。[2006-12-10更新:K.G. Schneider(Free Range Librarian在ALA TechSource上发表“Unsucking the OPAC: One Man’s Noble Efforts”,对Casey Bisson获奖给予很高评价,看看这句:“It is doubly exciting to see library software receive that kind of honor. Does your ILS deserve kudos from Tim Berners-Lee?”]

    由此去了解MATC到底是什么性质的奖。经查,这是著名的安德鲁·梅隆基金会(Andrew W. Mellon Foundation)所属六大核心项目之一信息技术研究(RIT, Research in Information Technology)首次颁发的年度奖项,奖励在高等教育及非赢利活动中协作开发开源软件工具的领先者。从颁奖公告(MATC 2006 Winners Announced)看,MATC奖委员会成员均是现今IT界的头面人物,万维网发明人Timothy Berners-Lee还亲自授奖。
    本次奖金总额65万,在MATC奖委员会提名的200多个项目中,有十项获奖。前三项奖金10万美金,后七项奖金5万美金:

Internet Archive因开源工具Heritrix Web Crawler (http://crawler.archive.org)获奖。Heritrix Web Crawler用于大规模互联网学术内容档案的网页抓取。

华盛顿大学因十数年来致力开发开源电子邮件工具获奖:IMAP邮件服务器(http://www.washington.edu/imap)和PINE邮件客户端(http://www.washington.edu/pine)。

Humboldt州立大学(加州)因支持开发的Moodle课程管理系统(http://moodle.org)获奖。

Rensselaer理工大学因Bedework事件日历服务器(http://www.bedework.org)而获奖。RPI重写了Bedework,使之得到了新的协作与开放社区的支持。

英国的开放大学也因Moodle课程管理系统而获奖,开放大学在Moodle及其社区中投入数千小时的编程工作,成为Moodle社区的领导者。

西班牙Lleida大学因Sakai课程管理系统(http://www.sakaiproject.org)而获奖,将Lleida大学将Sakai用于加泰罗尼亚语,为Sakai的国际化作出了突出贡献。

维吉尼亚理工学院和州立大学也因Sakai课程管理系统而获奖。维州理工为Sakai提供质量保证,并创新地在计算课程中将Moodle和Sakai作为编程项目。

耶鲁大学因开发中心认证服务(CAS, Central Authentication Service)(http://www.ja‐sig.org/products/cas)而获奖。数百大学校园因之提供用户的单点登录认证服务。

Plymouth州立大学因开发WPOPAC联机公共访问目录(http://wpopac.blogs.plymouth.edu)而获奖。WPOPAC把每条书目记录转为一个博客页面,使任何图书馆都能使其OPAC互动,用户可以发布评论。WPOPAC适合于任何规模的图书馆,用户因之能与图书馆及其提供的文献有更深入的交互。

加拿大不列颠哥伦比亚大学因开发公共知识项目(PKP, Public Knowledge Project) (http://pkp.sfu.ca)而获奖。PKP提供多种开源工具,支持开放的学术交流。具有在发展中国家创建虚拟学术与出版物的潜能。

    获奖单位都计划用所获奖金继续这些开源工具的开发,如开放大学打算开发一个离线版Moodle,维州大学打算为Sakai开发一个实验室笔记工具,等等。

    总结一下获奖说明,开源软件的最初开发固然必不可少,但应用与社区的维护,也是重要的方面。
    在RIT主页,还可以看到他们资助的各种开源项目。大名鼎鼎的DSpace和Fedora现由基金的另一核心项目“学术交流”(Scholarly Communications)资助。

虚拟上海:上海城市空间

    印半斋留言,说国图网站上有个中国学网络,问“是否可以从里面得知海外上海研究的情况”。
    国图网站丰富,我的盲点更多。既然听说了,就去一看。从主页的“中国学导航”进去,有“汉学家”和“中国学网络”。在中国学网络,检索到一个关于上海的网站。基本介绍

网址:http://virtualshanghai.ish-lyon.cnrs.fr/Image.php
网站名称:Virtual Shanghai——Shanghai Urban Space in Time
网站中文名称:虚拟上海:上海城市空间
创办人/机构:Christian Henriot
网站内容简介:该项目是始于2000年的合作项目,主要基于上海历史照片展现其发展脉络。由法国东亚研究所(Institut d’Asie Orientale)和美国加州伯克利大学中国研究中心(the Center for Chinese Studies of the University of California, Berkeley)合作,数字化了上海历史照片以及地图,试图追溯上海建成到现在的历史,但其重点侧重在19-20世纪的历史。
栏目设置:文件 图片 地图 参考文献 图片目录 总览 检索
特色资源:上海历史照片、相关研究文章等。包括与上海历史相关的上百张的照片和上千篇的文章。

    访问该网站,编者Christian Henriot(IAO东亚研究所/ Lyon 2 University里昂第二大学?)。2005年由法国国家研究局(Agence Nationale de la Recherche)选定为社科与人文研究项目,资助三年。与国图网站的说明不太一致。
    该项目着重十九世纪中叶至今的上海历史。目前主页显示现有记录14780条,大约是即时数据,统计表最新资料是10月25日的(今天才26日),为14659条。网站仍在建设中,但内容已经很丰富了:
   
    图片11148张,最为丰富;
    标有GIS信息的图片1483张;
    地图270张,最早标明年份的是这张1855年彩色的外国人定居点图(Ground plan of the Foreign Settement at Shanghai – North of the Yang Kang Pang Canal)
Ground plan of the Foreign Settement at Shanghai - North of the Yang Kang Pang Canal,对一下家里的地图,此图所示正是外滩这块地方。
    书目1617条,看到的语种有法、英、日、汉;
    ……

    想上网查“Yang Kang Pang”是否为洋泾浜,发现上图“馆藏精选”中也有此图,名《上海租界图》,说明是“上海开埠后第一份英租界地图”,但版本略有不同。看看吧:上海租界图
    
    查Yang Kang Pang时发现“虚拟上海”还有一个网址:http://www.virtualshanghai.net/

P.S.    今天很有感慨,发现老外好象把什么资料都开放了,而我们总喜欢把什么东西都藏着掖着。既然是自己辛辛苦苦做出来的东西,能够让更多的人用,不好吗?