Jonathan Rochkind写了一篇博文“Google Books, no longer offer PDF for public domain? (March 3, 2011)”,怀疑Google不再提供公共域图书的PDF下载。有人留言说该文误导,因为前晚他还下载了好多本。Jonathan于是承认他弄错了,下载链接躲在右上角落里,远不如电子书店那么醒目,而且还要输入识别字符后才能下载──为的自然是防止批量下载。
想来Jonathan在写博文前很是为Google取消公共域图书下载困惑了一阵的,因此我也去访问Google图书,看看是何种情形。
进入Google图书首页,在登录状态,上部显示My Google eBooks,因为曾经收藏过几册书。在收藏图书的封面图片下是灰色的Read Now按钮,点击就是双页的电子书阅读模式,找不到下载链接。返回点击封面图片,进入元数据页,右侧是蓝色醒目的Read Now按钮,也没有下载链接。Wonderful Stories for Children(点击看效果)
再回到Google图书首页,在My Google eBooks区域下部是Classics区域,都是公共域图书,一连点了多本,都只能阅读片断(Snippet view),自然更不会有下载链接了。想起来曾经测试过,这与IP有关,要是美国的IP,这公共域才普遍起作用。
那个神秘的下载链接在哪里呢?
于是试着在Google图书的搜索框里查上述书名。在结果一览中点击该书,显示页面完全不同,那个下载链接在页面右上角出现了,蓝色醒目的Read Now按钮则显示到了左侧,伴随着Google电子书店的购买广告。点击Download链接,选择下载PDF或EPUB,在输入识别字符后可以下载。Wonderful Stories for Children(点击看效果)
仔细看这同一本书两个链接,原来一个ebooks,一个是books。把上面网址后面部分去掉,就显示出非常相似的页面布局,只是Google图书有书内检索框,还有预览Preview this book链接。点击就预览就到了有下载链接的页面。
(上部:Google电子书店;下部:Google图书)
http://books.google.com/ebooks?id=ey8EAAAAQAAJ
http://books.google.com/books?id=ey8EAAAAQAAJ
在查找过程中发现,一方面,尽管是公共域图书,非美国IP也不一定能看全文;另一方面,很多新版图书,甚至是本世纪出版的,也可以全文阅读──不过没有下载链接。(在高级检索中选Full View即可)
Jonathan文中还说到HathiTrust仅向认证为其成员机构的用户提供完整的PDF,至少对其中Google扫描图书如此。他认为这是与Google协议规定必须限制PDF发布。
前些日子访问HathiTrust时就发现对于公共域可完全浏览的图书,只有单页PDF链接。难道登录后就会有整书PDF链接?HathiTrust中的同一本书:Wonderful Stories for Children(点击看效果)
多谢翻译提供了这么好的方法。