用网上信息解惑――Google Print编目应用实例

    编目时对文献本身的信息会产生一些疑问,诸如某个信息是丛编名还是一般的介绍性文字,等等。不动脑筋的方法是问人,只是被问者也不见得知道。如果被问者随口一答,甚至可以质疑,其答复又何以见得是正确的呢?
    我是属于懒得问人的。所以遇到这方面的疑问,采用的方法是“查”,或者说“问”各种OPAC,看看网上有没有类似的图书,看看类似图书是如何著录的。

    有些翻译图书的问题,不是查查OPAC就可以解决的,需要原书来解惑。现在可以通过Google Print使用网上图书。这是我遇到的一个使用Google Print的实例:

果壳里的60年 = Sixty years in a nutshell / (英)S?W?霍金等著 ; 李泳译. — 湖南科学技术出版社, 2005

    这是一本文集,在各种OPAC中查并列题名,并无题名为“Sixty years in a nutshell”的原版图书。看图书版权页信息:

Martin Rees, “Our complex cosmos and its future”
James Hartle, “Theories of everything and Hawking&aposs wave function of the universe”
Roger Penrose, “The problem of spacetime singularities: implications for quantum gravity?”
Kip Thorne, “Warping spacetime”
Stephen Hawking, “Sixty years in a nutshell” in Gibbons, Shelard & Rankin, (eds) The Future of Theoretical Physics and Cosmology. (c) 2003 Cambridge University Press

似乎书中各文出自The Future of Theoretical Physics and Cosmology一书。

    用“Sixty years in a nutshell”查Google Print,查到如下信息

The Future of Theoretical Physics and Cosmology : elebrating Stephen Hawking&aposs 60th Birthday by G W Gibbons, E P S Shellard, S J Rankin – Science – 2003 – 906 pages
Page 105 – 6 Sixty years in a nutshell Stephen Hawking Centre for Mat … Sciences, University of Cambridge 6.1 Introduction It was nearly 59.97 years in a nutshell. …

    显示“Sixty years in a nutshell”确为霍金在“The Future of Theoretical Physics and Cosmology”中所写的一篇文章。点击有霍金头像的图书封面,再点击左栏“Table of Contents”(目次首页),可看到翻译书中各文均出自该书之“Part 1: Popular symposium”。

    故可将原书名做到5XX中。

    在知道书名的情况下,理论上也可通过A9(http://a9.com)或亚马逊(http://www.amazon.com)看有关信息,只要该图书有书内搜索(Search Inside)或书内浏览(Look Inside)。但本例中的书在亚马逊虽有书内搜索,也有目次页链接,但却未显示目次首页(显示了后续页)。
    自然也有反过来的情况:亚马逊有某图书,而Google Print没有。如果只有目次中的篇名,似乎就很难查了――亚马逊的检索功能与Google不在同一档次上。

 

趋势:通过搜索引擎查找收费电子资源

    那些需要订购才能阅读的网上数据库,由于需要登录访问,所以无法被一般搜索引擎索引,而大部分人也无从知晓其收录内容。而现在,收费数据库“不可见”的情况已经渐渐地改变了。
    美联社6月16日消息,“图书馆供应商向搜索引擎提供资料”(Library supplier to provide material to search engines),说有约5000家美国公共、学术与军事图书馆参与Thomson Gale公司的试验项目,让Google和Yahoo扫描Thomson Gale的收费资源。这些资源日后会在搜索结果中一同出现,但只有参与计划图书馆的读者才能读全文。
    据说为避免搜索结果中订购内容淹没于免费网上资源,Thomson Gale公司为此开设了专门网站AccessMyLibrary,单独提供检索。
    上“雅虎订阅搜索”Yahoo Search Subscriptions去看,其实现在已有了IEEE publications、New England Journal of Medicine和Wall Street Journal等七个数据库。虽然Thomson Gale还要过些日子才会加入,但显然在雅虎,通过订阅搜索,结果是不会淹没于免费网上资源之中的。

    一方面让大型搜索引擎索引,一方面自己提供免费检索,全文数据库商的行动让我想起互联网流行前后联机检索公司的变化。
    在互联网流行前,数据库商本身不提供检索服务,而是将数据库交给联机检索公司如DIALOG(http://www.dialog.com/)之类,通过网络专线提供服务。当时主要是文摘索引,用户花费不菲,得到的结果只是文摘,还要花很多精力去找原文。
    互联网兴起后,出现了以免费索引吸引用户,通过提供原文获取利润的服务,如期刊目次服务UnCover。这时联机检索公司也想起提供原文,其实是很好的增值服务。
    再后来,全文期刊差不多已经取代文摘索引了,以提供期刊原文为生的UnCover式微,卖给了Ingenta。而互联网的开放,让很多数据库商可以自己提供服务,或直接将数据库卖给图书馆而不必借助于联机检索公司。于是,DIALOG需要通过Open Access提供免费检索,吸引更多的人气。至于接下别人愿不愿意付费看原文,那就是另一回事了。

    现在,被免费搜索引擎宠坏了的普通人,只需要结果,并不去考证结果的准确性;有免费资源、简单检索,根本不会费心去找订购资源。于是,拥有大量全文资源的数据库供应商,面对Google、Yahoo,就象当初面对UnCover之类的联机检索公司。
    这些需订阅使用的数据库,主要依靠图书馆订户,而图书馆在经费紧张的情况下,是否继续订购,无疑取决于数据库的利用率。
    只有让人知晓,才能更好生存。G5(很怪的简称)与Google合作索引其馆藏图书,也是此意。
    免费检索,大势所趋。

    有点奇怪的是维普,原来我很喜欢它。虽然没有全文检索,但收录期刊多,且在几个期刊全文库中,就数维普最为开放。www.tydata.com可以随意检索,颇合互联网免费检索的潮流。但前些日子发现,网址似乎换成了www.cqvip.com,无法随意访问了。希望不是我的网络连接有问题。

 

Google与Amazon书内搜索比较

    不知为什么,Google没有象Google Scholar那样,单为Google Print设一个检索页面,弄得大家要检索Google Print收录的图书时,只能在Google网页搜索时,使用“book”一词进行搜索(目前限英文界面)。而且,检索结果还只限3个。

    SearchEngineWatch新闻编辑Gary Price最近写了一篇破解之文“Going Under Cover with Book Search Tools”,传授了二种任意检索Google Print中图书的方法。

    方法一(例子改为我自己的了):
1、在Google搜索框输入检索词(注意“界面语言”选英文),如:book “information retrieval”
2、图书检索结果标记为:Book results for “information retrieval”。任意点击3种图书中的一种,如Visual Information Retrieval
3、在窗体下部有一个搜索框,边上有一个“Search all books”按钮,可以实现在所以Google Print图书中搜索。

    方法二比较简单,只是需要记一下。先在浏览器地址栏输入:
http://print.google.com/print?q=
再在等号后加上检索词,同样如”information retrieval”,检索结果相同。

2005-5-28更新
    Google Print首页已更新,设置了检索页面,所以Gary Price的“方法一”已无用武之地;“方法二”仍然有效,虽然直接使用没有什么意义,但可用于Google的“工具栏搜索”Google Deskbar
    原来Google Print首页内容现在放在About Google Print。

2006-1-23更新
    2005年晚些时候,Google Print已改称Google图书搜索:http://books.google.com/

    编目时偶而也用Google Print看图书的目次。这回花时间用了一下左栏的书内搜索(Search within this book),同亚马逊的书内搜索(Search Inside!)作一对比:

1、图书基本信息:
    亚马逊提供封面、目次、版权页、片段、索引、封底。“片段”是其可公共访问的页面,可前后翻页。
    Google提供封面、版权页、目次、索引。可由原文页前后翻页。
    二者相比差别不大。

2、搜索功能:
    Google可以用引号搜索词组,搜索结果比亚马逊更准确。

3、检索结果:
    亚马逊检索结果一览每项三行左右,有一定的可读性。
    Google检索结果一览每项二行,且行宽小于亚马逊,基本不可读。

4、原文显示:
    对一般检索者,亚马逊只显示可公共访问的“片段”页面。只有注册用户才能由检索结果点击页码看原文,即使该页属于其公开的“片断”。
    Google可直接由检索结果点击相应页码看原文:
1) 不是每页都可看,比如对于Encyclopedia of Library and Information Science,第435页即显示[Sorry, this page&aposs content is restricted.]。
2) 一本书肯定不能从头看到尾,但没有地方显示究竟可以看几页。据Gary Price说,可看页数由出版商决定(Publisher Program)。
3) 那些由Google图书馆计划(Library Project)数字化的图书,如果受版权保护,则只能看书目信息,即Book Info View Only。Gary Price说在美国公共领域是1923年前,如果在美国以外,Google会认定在1900年前!这么古老的内容,如果真有价值,相信谷腾堡计划(Project Gutenberg)中也会有的了,或许“善本”例外(外行话不足为凭)。

5、原文保存与打印:
    亚马逊:不可选择保存原文图像,打印时原文位置留空,但可通过保存网页方式保存原文(独立的jpeg文件;2005/5/14更新:仅限显示的第一页)。
    Google:不可选择保存原文图像,打印时原文位置留空,原文无法保存(保存网页后原文每次均需联网下载),唯一的保存原文方法就是拷屏(PrintScreen)了。

当日更新(21:30):

    刚看了蒙大拿州立大学参考馆员Greg R. Notess在Online (vol.29 no.3 May/June 2005)上发表的专栏文章:Searching Books Between the Covers。该文讨论的也是书内搜索问题。文中有历史描述,有些有趣的Google、Amazon和A9搜索对比,还有书内搜索在参考服务中应用的实例。
    如作者所言,书内搜索仍在不断变化。所以他的文章、Gary Price的文章以及上文,或许很快就过时了。