中文图书搜索网站比较

    前几天写“百度图书搜索试用记”时,在百度贴吧看到“百度四月底图书搜索线,展望与猜想”,又看到二个图书网站。与百度图书搜索一样,也用“刘国钧”查,对照一下结果(“百度一下,找到相关网页133篇”)。

朗润书目(http://book.lrbook.com/)
找到与 刘国钧 相关的图书约 62 种

觉得检索结果页面很像超星:
左栏是中图分类,可以按类限定检索(对排除不同学科同名作者很有用);
右侧是带封面的简单书目信息,可以选择按书名、作者、出版日期排序。
详细信息页除图书封面及书目信息(包括主题词)外,还可以“试读”版权页、前言、目录及正文10页(推荐!)。

据介绍,朗润书店是个专为图书馆提供图书的书店,详细信息页还有“图书馆借阅”,显示的应该是从该店购书的图书馆链接,有点像联合目录,大都直接链接到各馆OPAC记录。

用户参与部分与做得很好,在详细信息页,可以“收藏到我的图书馆”,看到“本书收藏人”“收藏本书的专题馆”;也可以给本书“评分”(1-5颗星)“报告错误”“推荐朋友”“发表我的评论”“添加信息”(欢迎转发各类媒体上与本书相关的信息)甚至“我要提供”(全文)。

编目员或许感兴趣的“获得CNMARC数据”则要通过发邮件获取。也是到了此页面,才发现原来转到了“读秀”(http://www.duxiu.com),“我的图书馆”、“专题图书馆”都是读秀上的内容,据称已有35万注册用户了。怪不得前面觉得像超星呢,原来是同胞啊。才想起贴吧上那位说的是:“读秀已出,谁与争锋”。

中文图书信息库(http://www.cbdb.cn/)
找到与 刘国钧 相关的图书约 102 种

缺省为按相关度排序,也可按出版日期正序、倒序排列

结果数比百度图书搜索少,但排序方式不错。
按出版日期正序排,可以看到其中收录了不少民国时期图书,要做近代学术研究,应该是个不错的信息搜寻地。在检索结果中随意找了一本《江西暑期学术讲演集》,在百度、朗润、读秀中均未查到。

详细信息页有“图书详情”“发表评论”“上传此书的封面”“此条目有错误?”,均需注册登录才能参与;还可以“把这本书加入我的收藏”,分为“读过”“在读”“想读”,自然也需登录。从“本书常用标签”可以推测,登录后可以为图书加标签。用户体验不如朗润/读秀,至少我现在是见到要注册,第一个念头就是放弃,看都没看到能做些什么、已经做了些什么,凭什么就要注册?看图书详情就要注册,更不应该。

网站显示“目前可查询图书信息: 2207515+”,收录信息丰富不用说。但“个人书架”“专题书架”甚至“帮助与设置”都还只是空设的;论坛虽有867个会员,但总共才109篇主题、205篇帖子,与读秀之热闹尚有距离。

    网站上没有对自己的任何介绍。据“百度四月底图书搜索上线,展望与猜想”一文所说,中文图书信息库是由“IT界元老级人物,手机在线创始人高春辉paulgao和朋友合办的”。

   最后如前文所说,“google图书搜索真的很差”:

谷歌图书搜索(http://books.google.cn)
搜索 刘国钧 共得到 4 本图书

结果真是少得可怜。不过,由于搜索包括图书全文而不限于目次简介,很多情况下可以看到在搜索结果标题栏标明了页码,这表明可以直接链接到搜索词所在页面、看到上下文。这也是其它几个中文图书搜索、包括电子书网站均不具备的功能。电子书网站目前都是看前XX页,也未提供全文搜索。

豆瓣(http://www.douban.com):3个结果
豆瓣粉丝很多,就不说了。(今天好不容易看到一个说它坏话的
参见:用“豆瓣”的一站式图书搜索帮助编目 (2005-09-06)

附电子书网站检索结果,使用情况详见“百度图书搜索试用记
超星(http://www.ssreader.com/)
找到与刘国钧相关的图书 12 种
阿帕比(http://search.apabi.com/)
约有2项结果

通过WorldCat.org查期刊论文

    记得OCLC的联合目录WorldCat中的记录前两年达到1千万,当时作为OCLC编目成员馆,还曾收到几个庆祝的小徽章。到今年3月29日,WorldCat记录数竟暴曾到了1个亿。根据OCLC首席科学家Thom Hickey的说明(Outgoing: 100 Million OCLC Numbers),原因有三:
首先是RLG的并入,为WorldCat提供了大量书目记录;
其次、也是影响最大的是,3月26日开始,OCLC把期刊论文信息加到了WorldCat.org中(OCLC. News and Events: Significant increase in OCLC number count);
第三,WorldCat记录去重规则改变,由于收录各国国家图书馆的记录,因而不再合并同一实体的不同语种书目记录(也就是说,同一种书,可能有用英语、法语、德语……著录的多条记录)。

    4月19日,完成了FirstSearch四个数据库(GPO, ArticleFirst, Medline and ERIC)期刊论文信息加载后,OCLC宣布升级的WorldCat.org开始提供期刊论文(OCLC. News and Events: Article-level citation records in WorldCat.org results)。根据IP地址,向使用者提供不同形式的链接:
· 链接到订购的联机数据库全文
· 链接到图书馆的链接解析器以访问相关文章
· 链接到文章传递服务

    对于非OCLC用户,自然享受不到上述链接服务。升级后的WorldCat.org主要可以用来查期刊文章的出处,并链接到期刊自己的网站。

    OCLC副总裁Lorcan Dempsey举了几个查人名的例子(Lorcan Dempsey's weblog: Worldcat.org and articles),看看查“manuel castells”吧(“结果大约有 35条”)……
   
    与Google Scholar相比?同样查“manuel castells”(约有10,200项符合"manuel castells"的查询结果):

检索功能:WorldCat.org较强,在检索结果较多时,它的与图书相同的限定检索功能(“精练您的检索”)很有帮助。Google Scholar侧栏只有相关作者提示,WorldCat.org则有作者、内容、语种、年份等可用于对检索结果作进一步限定。

检索结果:显然WorldCat.org数量较少。猜想原因:一是Google Scholar收录大量书刊引用信息;二是FirstSearch的这四个库收录期刊数量不够大。
不过,数量少并不能说明WorldCat.org只是Google Scholar的一个子集。如WorldCat查到的第一篇“Revolt against violence”在Google Scholar中就未收录。

就目前而言,WorldCat.org提供期刊论文检索还是为FirstSearch服务的,目标是其数据库订户。对非订户来说,没有网上免费的全文链接,就是其最大的硬伤了。如在WorldCat上查到的第二篇“Global Governance and Global Politics”,在Google Scholar上就可以找到原文。

总结如下:Google Scholar虽有找到全文的机会,但检索结果太多,又缺少有效的限定检索手段。使用时可以考虑与WorldCat.org结合,先在WorldCat中锁定目标,再到Scholar中获取全文。只是此法由于FirstSearch数据库的收录局限,漏检难以避免。

Google合作馆如何处理他们的数字化图书

    尽管官司缠身,Google图书搜索的合作馆仍在日益壮大,已经从英美扩大到了西班牙和德国,二年多时间从G5变成了G12。媒体关心Google如何处理那些数字化图书,而图书馆界则关心合作馆如何处理那些数字化图书——根据合约,合作馆向Google提供图书,Google数字化后会返回一份数字拷贝给合作馆。尽管合作馆以前都有过各自的数字化项目,但规模如此大的还是首次,除保存而外,又该如何利用呢?Jill E. Grogg和Beth Ashmore在Searcher上的文章“Google Book Search Libraries and Their Digital Copies”提供了一个概述。

◎ 加州大学(UC,2006年8月加入):未确定如何使用。但属于公共领域的资料会在本校自由无障碍地全文访问,比如链接到OPAC (Melvyl)中;受版权保护的图书仅在版权法范围内可访问。UC组织了一个小组,解决下一步如何将这些数字图书集成进自己的馆藏。

◎ 哈佛大学:目前没有使用这些数字化图书。未来的使用正在考虑中,但没有具体计划。尽管如此,正想像未来可以利用这些数字馆藏做文本挖掘,相信会为研究工作开创新的途径。

◎ 纽约公共图书馆:仍在计划如何使用,关注其他合作馆的相关动向。想像未来在检索他们的数字画廊时,不仅接收图片,而且还有有助于进一步研究的相关文本。

◎ 牛津大学:目前只计划如何保存这些数字化图书,如何更好地使用仍在探索中。牛津将从其OPAC链接到存于Google图书搜索的图像。

◎ 佛吉尼亚大学(UVA,2006年11月加入):到时会找到可做的事,比如给内容增值,但目前还不知道。

◎ 维斯康星大学麦迪逊分校(UW-M):对组织与提供访问有独特的计划。打算通过OPAC检索,与机构合作委员会(CIC)成员分担数字存贮。

◎ 密歇根大学:已有目前最发达的系统MBooks,提供访问其Google扫描资料。MBooks使用户可以通过在OPAC (Mirlyn)中的全文检索,找到图书并链接到图书页面(page turner)。在那里可以浏览、打印、放大、旋转页面,也可以做书内检索,并提供链接到Google图书搜索(那里有可能提供整书PDF文件下载)。数字化图书一般为600dpi G4压缩单页,重要插图为300dpi JPEG 2000图像;Google还提供配合每一页图像的OCR文本文件。

    总体来说,通过OPAC检索这些数字化图书,是大部分合作馆设想的主要利用途径。
    除了Google二巨头的母校参与计划最早,已经有实质性的使用外,其他合作馆基本上是有设想、没计划。
    大概是东西来得太轻易,就好像一个工薪族,一下子中了数亿六合彩,如何处理才不至于给生活带来负面影响,是够规划一阵子了。

    据称Google图书搜索的URL是固定的,任何组织都可以链接到Google图书搜索,而不用担心网址改变。

出处: Google Book Search Libraries and Their Digital Copies / by Jill E. Grogg, Electronic Resources Librarian, The University of Alabama Libraries; and Beth Ashmore, Cataloging Librarian, Samford University. Searcher, Vol. 15 No. 4 — April 2007    

参见:
Google Print:读者、图书馆、出版社、书商皆大欢喜 (2004-12-15)
Google Book Search当初叫Google Print。以为该皆大欢喜,结果商人不这么想,提供个背景吧。

Google数字化图书将终结传统图书馆? (2004-12-18)
好象图书馆也不这么想。一家之言。