民国期刊全文数据库四种

民国期刊全文数据库,以前一直用国图和CADAL的。
最赞的是国图,完全公开访问。据河边前辈称国图的来自当年从全国征集的缩微期刊,因而只要有的品种,卷期都比较全。惜乎这事后来没有持续下去,所以国图民国期刊品种不算多,目前网站上提供4351种期刊。
相比之下,CADAL的民国期刊更为逊色。据2006年9月的检索结果,当时有民国期刊3802种,且卷期极为不全。看CADAL二期计划新增14万期(CADAL资源介绍),或可有所改善。

检索方面,国图目前优于CADAL的是提供目录(也就是篇名)检索,但检索结果到刊而非到期,因而这种“目录”检索基本上是无用的功能。试想如果该刊有30期,除了一期期看过来,没有办法知道想要看的到底是哪期,更不会说是哪篇(具体页码),还有多大的意义?
作为全文库,国图和CADAL的民国期刊库存在一个致命缺陷──没有篇作者信息。由于不是基于篇名做索引,而是以期为单位做目次,既没有给篇作者定义元数据,做目次时也没有录入作者信息,导致以现有信息根本没有办法查到篇作者。未来如果不辅以强大的技术手段提升其功能(OCR识别全文并定位作者),无法改变现状。
简言之,国图和CADAL民国期刊库的最大问题在于它们作为检索工具,只是目录而非索引。期刊目录基本上只适合查找从其他来源已知的文献,根据已知的刊名、卷期找到所需文章。期刊索引才能发现文献,对旧刊来说,特别有用的是查找某位作者有哪些文章,发表在什么期刊、何卷、何期。

去年底《大成老旧刊全文数据库》在本馆试用,这是个基于篇的期刊索引库,据称有6千余种刊、12万多期、150万余篇文章。当时用一位民国作者查了一下,可以查到一些,但由于没有比对,不清楚覆盖范围。
前不久微博得知《复印报刊资料》《全国报刊索引》也有《民国期刊全文数据库》,然后在本馆网站上发现3月下旬曾有短暂试用。现在虽然已经结束试用,或许因为在继续试用它家的《民国时期期刊篇名数据库》的缘故,全文库仍可以查(不能下载全文),于是用同一位作者查了一下,命中结果是大成的近十倍!不过并没有涵盖所有大成的期刊(但其篇名库有)。看介绍目前收录5千多种4百万篇(比大成品种少、但篇数多,可见卷期较全),最终会达到2万多种,如此,恐怕无敌了。
有点奇怪的是,篇名库与全文库并不对应,还有全文库有、篇名库却没有的情况。

———-民国期刊全文库四种———-
国家图书馆:民国中文期刊
来自缩微胶片的数字扫描工作,预计将在三年内完成近600万拍缩微胶片的数字转换。现提供4351种期刊电子影像的全文浏览。资源库遵循边建设边服务的原则,将不断追加更新资源库内容。
访问网址:http://res4.nlc.gov.cn/home/index.trs?channelid=6(公开访问、全文浏览)

CADAL(高等学校中英文图书数字化国际合作计划)
已建资源:236,594册民国书刊(未区分书刊);在建资源:民国文献20万册(期),包括:民国图书4万册,民国期刊14万期,民国报纸2万期。
访问网址:http://www.cadal.cn/(公开查询、注册后全文浏览──特定IP范围?)

《大成老旧刊全文数据库》
收录清末自有期刊以来到1949年以前(1840-1949),中国出版的6000余种期刊,共12万多期,150万余篇文章。
访问网址:www.dachengdata.com
提供公开检索,检索途径:题名(篇名)、作者、内容提要、刊名。检索一览显示:题名、作者、刊名、年卷期。──即使没有买该库,作为查找工具也不错。

《民国时期期刊全文数据库(1911~1949)》(《全国报刊索引》)
计划收录民国时期(1911~1949)出版的两万余种期刊,一千五百余万篇文献。
分辑出版(每辑250GB),目前的数量:
第一辑 1142种 31533期 811044篇
第二辑 1245种 28263期 830326篇
第三辑 1145种 31382期 794213篇
第四辑 2098种 30856期 804569篇
第五辑 (种、期不详)769345篇
《全国报刊索引》以索引起家、目前仍在销售篇名库,因之该库不登录不能查,对未订购者,这访问网址也没啥意思了:www.cnbksy.cn

P.S. 一直很奇怪,民国元年明明是1912年,为啥我们的民国文献都是从1911年开始算的呢?

———-分割线———-

《晚清期刊全文库(1833-1910)》试用记 (2010年11月29日)

电子版民国图书和期刊 (2006年9月27日)

国家图书馆民国期刊全文下载方法 (2007年10月18日)──方法已失效

国家图书馆民国电子书 (2007年6月26日)

“百万图书”项目(CADAL)相关信息

    曾经写过一篇博文,批评百万图书项目“数字化《四库全书》”。不过自己现在想法改变了,因为在国内简称CADAL的百万图书项目,把古籍、民国书刊之类没有版权限制的文献都放在公网上,让大家共享。此等做法,在国家资助项目中似乎难得一见,是好事当然要“顶”。
    竹帛斋主作为CADAL成员馆的住持,“温柔地”批评管理中心,自然有他的道理。而对于我等非成员馆,不能看现代图书是很能理解的,违“法”的事哪个敢随便做?

    Karen Coyle在文章“Mass Digitization of Books”(Journal of Academic Librarianship, v. 32, n. 6, 预印本)中把百万册图书项目称为Large-scale Digitization,对应于Google Books那样不做筛选的Mass Digitization。文中称该项目为“卡内基·梅隆百万册图书”(Carnegie Mellon Million Book project):始于2001年,在中国、印度和埃及数字化图书。由于项目宣称长期目标是“以数字化形式抓取所有图书”(The primary long-term objective is to capture all books in digital format),Karen称其为当今mass digitization运动的先驱。目前百万册图书项目已与开放内容联盟(Open Content Alliance)合作,加入到mass digitization运动中。

相关资料链接:

2001年报告:百万图书数字图书馆项目
Reddy, Raj and Gloriana StClair. The Million Book Digital Library Project. Carnegie Mellon University. (December 1, 2001)
http://www.rr.cs.cmu.edu/mbdl.htm

百万图书项目常见问题
Frequently Asked Questions About the Million Book Project
http://www.library.cmu.edu/Libraries/MBP_FAQ.html
其中有截至2005年11月的图书扫描数据:印度17万,中国42万,埃及2万;其中英语13.5万;大部分为没有版权的,6万余有版权,其中英语约5.3万,印度语言7千。

卡内基·梅隆大学图书馆网站上链接的三个网站:
1、百万图书中国网站:寰宇图书馆(Universal Library) http://www.ulib.org.cn
是中科院研究生院的,有些项目初期的信息,没有图书
2、百万图书印度网站:印度数字图书馆 http://dli.iiit.ac.in
有截止到2005年4月8日的统计信息,共5.7万册。
3、百万图书美国网站:寰宇图书馆(Universal Library) http://www.ulib.org
没有相关统计数据。
后两者有全文,安装AlternaTIFF(http://alternatiff.com/)后即可浏览tiff页面和txt文本。
埃及呢?只听说CADAL成员馆到埃及开会,没见到埃及在百万册书中的相关链接。

中国网站最新信息、全文浏览尽在CADAL (China-American Digital Academic Library):高等学校中英文图书数字化国际合作计划(China-US Million Book Digital Library Project)
两个名称,真让人困惑啊,如果再加上那个寰宇图书馆(Universal Library),就更困惑了。
http://www.cadal.net
http://www.cadal.cn
http://www.cadal.zju.edu.cn(看全文需要下载DjVu插件)

介绍百万图书项目的论文:
陈海英,竺海康:中美百万册数字图书馆项目综述
《大学图书馆学报》2005年第1期第3-6,13页