国家图书馆民国期刊全文下载方法

几个月前,一位网友在“电子版民国图书和期刊”下留言,询问如何使用FlashGet下载国图民国期刊。在解答了 FlashGet 问题之后,通过与之多次e-mail交流,又解决了文件格式问题,并且由此了解到了下载链接、最佳阅读软件,掌握了全文下载的各个环节。应该说,我固然帮ta解决了问题,但我从ta那儿获得的更多。

事情完后,我并没有打算把下载方法写成博文。因为对我来说,那似乎是个禁忌──自己也做这个行当,知道图书馆在多种选项中确定逐页浏览的目的就是不希望全文下载。就我而言,主要是担心下载后电子书的去向不可预知,因为中国的互联网最不缺的就是强盗小偷。
自然也明白,自己不过是一只鸵鸟,把头埋进沙堆,好象问题就不存在了。其实在图书馆之外的社区,有很多检索高手,他们可以解决惯用高价数据库的图书馆人难以想像的问题──以前bujai就曾多次谈起,而此次我得以掌握下载方法,也全赖网友提供的相关信息。

但事情并没有就这样过去。前两天,又一位网友来信,询问如何批量下载国图民国期刊。思之良久,决定把详细步骤告诉他以后,写成此文,广而告之。一方面,需要下载民国期刊的人,绝大部分都是些研究者,为他们提供方便,对图书馆也是天经地义的事。另一方面,所谓道高一尺、魔高一丈,如果国图方面认为这是个需要弥补的漏洞,也好让他们知道大门早已洞开,赶紧想法堵上吧!

(update 2007-12-1:
请慎用此法。反精灵留言:“您这是害人呵!国图有防恶意下载的措施,凡是恶意下载,会被封ID的。”)

(update 2008-9-12:
国家图书馆二期开馆,网站改版,民国专栏的图书、期刊、法律文献一律改用PDF方式阅读,以下方法失效!)

国图民国期刊整册下载方法

先在国家图书馆民国期刊网站下载专用阅读器NLCReader后安装,然后“检索”到自己所需期刊。接下来的全文下载步骤如下:

1、先获取各页面的URL
使用阅读器打开所需卷期(单册),点击菜单"章节"后,侧栏会出现章节目录。任意选择一个,用鼠标右键获取页面链接(复制快捷方式)。以《通商海关华洋贸易全年总册》为例,第一册“1905年1904卷”的某个链接为:
http://res1.nlc.gov.cn:9080/dob/servlet/getPart?id=00J0027650001&section=Data&pid=4001400
则此册首页的链接为:
http://res1.nlc.gov.cn:9080/dob/servlet/getPart?id=00J0027650001&section=Data&pid=4000100
阅读器右下角有总页数22,据此,末页链接为:
http://res1.nlc.gov.cn:9080/dob/servlet/getPart?id=00J0027650001&section=Data&pid=4002200

2、用网际快车软件(flashget)批量下载
运行FLASHGET,在"任务"菜单中"添加成批任务",按示例做。以上面的链接为例,在URL部分输入:
http://res1.nlc.gov.cn:9080/dob/servlet/getPart?id= 00J0027650001&section=Data&pid=400(*)00
然后设定从01到22,通配符长度为2(2位数字),然后按"确定"就OK了。如果总页数为3位数(如125),则最后部分改为40(*)00,然后设定从001到125,通配符长度为3。

3、使用XNview浏览、打印
下载后的页面是JBG格式的文件。下载后文件名为getpart(*)(*为数字),没有扩展名,需要将文件扩展名改为.jbg。
有几种软件可以浏览JBG格式的文件。如果采用XNview,可以只改第一个文件后缀,然后采用前后翻页的方法看各页并打印。
由于各页文件名都是getpart,批量下载时以下载完成先后加后续数字,所以实际上浏览时的顺序与原刊不同。如果看打印稿,可以在打印后,按页面标示的页码重新理一下顺序;如果看电子稿,可根据实际顺序重新命名文件。如果不幸碰到一册中多段标页的情况(在民国期刊中也不少见),就没有办法了。要保证准确,或许只能逐页核对(那与非整册下载也没多大差别了)。

参见:
卓虎学术:绝对可用的中国数字图书馆入口及其下载方法