“百万图书”项目(CADAL)相关信息

    曾经写过一篇博文,批评百万图书项目“数字化《四库全书》”。不过自己现在想法改变了,因为在国内简称CADAL的百万图书项目,把古籍、民国书刊之类没有版权限制的文献都放在公网上,让大家共享。此等做法,在国家资助项目中似乎难得一见,是好事当然要“顶”。
    竹帛斋主作为CADAL成员馆的住持,“温柔地”批评管理中心,自然有他的道理。而对于我等非成员馆,不能看现代图书是很能理解的,违“法”的事哪个敢随便做?

    Karen Coyle在文章“Mass Digitization of Books”(Journal of Academic Librarianship, v. 32, n. 6, 预印本)中把百万册图书项目称为Large-scale Digitization,对应于Google Books那样不做筛选的Mass Digitization。文中称该项目为“卡内基·梅隆百万册图书”(Carnegie Mellon Million Book project):始于2001年,在中国、印度和埃及数字化图书。由于项目宣称长期目标是“以数字化形式抓取所有图书”(The primary long-term objective is to capture all books in digital format),Karen称其为当今mass digitization运动的先驱。目前百万册图书项目已与开放内容联盟(Open Content Alliance)合作,加入到mass digitization运动中。

相关资料链接:

2001年报告:百万图书数字图书馆项目
Reddy, Raj and Gloriana StClair. The Million Book Digital Library Project. Carnegie Mellon University. (December 1, 2001)
http://www.rr.cs.cmu.edu/mbdl.htm

百万图书项目常见问题
Frequently Asked Questions About the Million Book Project
http://www.library.cmu.edu/Libraries/MBP_FAQ.html
其中有截至2005年11月的图书扫描数据:印度17万,中国42万,埃及2万;其中英语13.5万;大部分为没有版权的,6万余有版权,其中英语约5.3万,印度语言7千。

卡内基·梅隆大学图书馆网站上链接的三个网站:
1、百万图书中国网站:寰宇图书馆(Universal Library) http://www.ulib.org.cn
是中科院研究生院的,有些项目初期的信息,没有图书
2、百万图书印度网站:印度数字图书馆 http://dli.iiit.ac.in
有截止到2005年4月8日的统计信息,共5.7万册。
3、百万图书美国网站:寰宇图书馆(Universal Library) http://www.ulib.org
没有相关统计数据。
后两者有全文,安装AlternaTIFF(http://alternatiff.com/)后即可浏览tiff页面和txt文本。
埃及呢?只听说CADAL成员馆到埃及开会,没见到埃及在百万册书中的相关链接。

中国网站最新信息、全文浏览尽在CADAL (China-American Digital Academic Library):高等学校中英文图书数字化国际合作计划(China-US Million Book Digital Library Project)
两个名称,真让人困惑啊,如果再加上那个寰宇图书馆(Universal Library),就更困惑了。
http://www.cadal.net
http://www.cadal.cn
http://www.cadal.zju.edu.cn(看全文需要下载DjVu插件)

介绍百万图书项目的论文:
陈海英,竺海康:中美百万册数字图书馆项目综述
《大学图书馆学报》2005年第1期第3-6,13页

《“百万图书”项目(CADAL)相关信息》上有5条评论

  1. 上网站看一下过去的好书,也是一种享受(但也真花时间呀)!相信你们会成为成员馆的!

  2. CADAL还不错,起码可以看到那些没有版权的古籍和民国图书。

  3. 2006年的文章,毕竟有些旧了。直接参与了UDL中国站点的建设,一些信息可以帮更新下,确实现在也还没有对外提供好的说明。
    整个UDL项目现在是又153万册左右数字图书,其中中国100多万,印度33万,还有埃及的几万。大部分英文图书还没有解决版权问题。中国古籍已经解决。
    CADAL, ULIB.cn等的关系是, CADAL位于浙大,主要负责中文图书数字化,是ULIB中国南方技术中心,www.cadal.edu.cn也是一个提供比较完整的检索和发布平台,是真的可以实用化的,从这一点讲,CMU的主站都做不到;但CADAL站点主要只有中文图书。而www.ulib.org.cn经过多次改版,已经提供了所有153册图书的镜像检索,涵盖了所有数据,并拥有北方中心15万册英文图书的全文检索系统、插图检索系统和知识网络系统,ulib.org.cn现在可提供所有版权允许的图书的访问。

评论已关闭。