“百万图书”项目(CADAL)相关信息

    曾经写过一篇博文,批评百万图书项目“数字化《四库全书》”。不过自己现在想法改变了,因为在国内简称CADAL的百万图书项目,把古籍、民国书刊之类没有版权限制的文献都放在公网上,让大家共享。此等做法,在国家资助项目中似乎难得一见,是好事当然要“顶”。
    竹帛斋主作为CADAL成员馆的住持,“温柔地”批评管理中心,自然有他的道理。而对于我等非成员馆,不能看现代图书是很能理解的,违“法”的事哪个敢随便做?

    Karen Coyle在文章“Mass Digitization of Books”(Journal of Academic Librarianship, v. 32, n. 6, 预印本)中把百万册图书项目称为Large-scale Digitization,对应于Google Books那样不做筛选的Mass Digitization。文中称该项目为“卡内基·梅隆百万册图书”(Carnegie Mellon Million Book project):始于2001年,在中国、印度和埃及数字化图书。由于项目宣称长期目标是“以数字化形式抓取所有图书”(The primary long-term objective is to capture all books in digital format),Karen称其为当今mass digitization运动的先驱。目前百万册图书项目已与开放内容联盟(Open Content Alliance)合作,加入到mass digitization运动中。

相关资料链接:

2001年报告:百万图书数字图书馆项目
Reddy, Raj and Gloriana StClair. The Million Book Digital Library Project. Carnegie Mellon University. (December 1, 2001)
http://www.rr.cs.cmu.edu/mbdl.htm

百万图书项目常见问题
Frequently Asked Questions About the Million Book Project
http://www.library.cmu.edu/Libraries/MBP_FAQ.html
其中有截至2005年11月的图书扫描数据:印度17万,中国42万,埃及2万;其中英语13.5万;大部分为没有版权的,6万余有版权,其中英语约5.3万,印度语言7千。

卡内基·梅隆大学图书馆网站上链接的三个网站:
1、百万图书中国网站:寰宇图书馆(Universal Library) http://www.ulib.org.cn
是中科院研究生院的,有些项目初期的信息,没有图书
2、百万图书印度网站:印度数字图书馆 http://dli.iiit.ac.in
有截止到2005年4月8日的统计信息,共5.7万册。
3、百万图书美国网站:寰宇图书馆(Universal Library) http://www.ulib.org
没有相关统计数据。
后两者有全文,安装AlternaTIFF(http://alternatiff.com/)后即可浏览tiff页面和txt文本。
埃及呢?只听说CADAL成员馆到埃及开会,没见到埃及在百万册书中的相关链接。

中国网站最新信息、全文浏览尽在CADAL (China-American Digital Academic Library):高等学校中英文图书数字化国际合作计划(China-US Million Book Digital Library Project)
两个名称,真让人困惑啊,如果再加上那个寰宇图书馆(Universal Library),就更困惑了。
http://www.cadal.net
http://www.cadal.cn
http://www.cadal.zju.edu.cn(看全文需要下载DjVu插件)

介绍百万图书项目的论文:
陈海英,竺海康:中美百万册数字图书馆项目综述
《大学图书馆学报》2005年第1期第3-6,13页