Google图书搜索的电子书网址

    越来越多的图书被数字化并上网,如果能够在OPAC中揭示出这些电子书的存在,无疑将方便读者利用。要在OPAC中提供链接,首先需要解决的问题是得到这些电子书的网址。Karen Coyle曾设想建立一个转换数据库("switching" database),能够通过LCCN、ISBN、OCLC#及少量书目元数据,获取数字图书的URL(包括Google图书搜索、开放内容联盟OCA及古登堡计划)。除非这些数字化项目本身支持,否则这个大工程可是很棘手的。

    Google图书搜索(GBS)虽则官司缠身,可与之合作的图书馆却在陆续增加,数字化的图书也在不断上网。目前能提供全文阅读的比例不高(美国以外这个比例更低),但能够阅读部分、或者目次也有一定需求,因此增加GBS的链接,对图书馆有了一定的吸引力。

    在近年OPAC的改进过程中,使用亚马逊的信息比较多。除了内容丰富外,技术上的原因主要是亚马逊在有ISBN的情况下,直接用ISBN号作为其标识,可以很方便地构成图书各方面信息的URL,提供链接;另一个原因是亚马逊提供API,可以把封面、书评等内容直接嵌入OPAC的显示页面。而这两点,对GBS似乎都不存在。

    查GBS就会发现,它的图书标识是一长串似乎随机生成的代码,如“5EccAAAACAAJ”,据说是根据数字化时图书的条码号生成的。澳大利亚国家图书馆的LibraryLabs是很少几个链接GBS的OPAC,它规避了特定电子书的URL问题,通过OPAC检索时所用词串检索GBS得到一批图书封面及链接。而一般OPAC需要链接到某一特定版本,没有其标识号无法实现。

    其实GBS不只有一个ID,ISBN、OCLC#都可能是ID (vid, varied id?),这种多重ID的形式,其实对提供链接是一个福音。如前述ID的这本书,是庄子逸、许文霞所译兰开斯特的《通向无纸情报系统》,在GBS中查得到的URL是http://books.google.com/books?id=5EccAAAACAAJ,而用ISBN号的URL是:http://books.google.com/books?vid=7502305424

    美国东密歇根大学在去年十一月就通过OCLC#在OPAC中动态提供GBS的链接(根据是否能获取全文,给出不同的显示文字)。根据用此法得到的数据,仅有约5%有全文,约10%可以看片断。[update 2007-9-28] Wake Forest 大学 Professional Center Library 也采用东密歇根大学的方法提供GBS链接,一个使用OCLC#的实例:http://books.google.com/books?vid=OCLC49284042

    问题在于,无论是ISBN还是OCLC#,都不能保证查到实际上存在的GBS电子书。比如:http://books.google.com/books?id=CV0lHa0j2YAC,该书的ISBN为0802142818,但用http://books.google.com/books?vid=0802142818则没有结果 [2007-9-28更正:用http://books.google.com/books?vid=ISBN0802142818可以检索到。也就是说,使用ISBN时,加上ISBN标识检出可能性较高]。Karen举了另一个例子:http://books.google.com/books?id=MgSoZJLtmGQC。此书在哈佛大学书目中的OCLC#是16730575,但用此号构造出的URL并不存在(Not Found)。关于OCLC#,据说在WorldCat中对数字化图书都会另外给一个OCLC#,如此则原来纸本的OCLC#在这种情况下有用性大大降低。对于大量早期没有ISBN的图书,就只有利用GBS的ID一条途径了。

    LibraryThing的Tim Spalding要获取GBS的ID。因为之前AADL的John Blyberg曾试图用机器人获取,结果被Google封杀,所以Tim想如之前LT做合并同一版本那样,再次依靠群众的力量。他做了一个名为"Google Book Search Search"的小书签(bookmarklet),让LT用户及其他人在访问GBS时使用,以获取GBS的图书ID。由于是不同IP的人在分散访问GBS,或许可以避免被Google封杀——关于此点,Tim没有把握,毕竟是同用一个程序在获取数据。他在早上2点发布GBSS小书签,到晚上10点多发贴时,已有超过300个LT用户装上并开始使用了。
    Tim承诺所有获取的数据将会共享,供图书馆强化自己的OPAC。并设想(有了足够的数据后)在LibraryThing for Libraries中作为免费的部分提供。目前LT用户提供的数据可以在该网站的“Google Book Search Search Data”看到,全部数据的XML文件也可以下载

via: NGC4LIB
Adding links to books in Google Book Search within the OPAC (2007-9-14)
Announcing Google Book Search, um, Search (2007-9-17)

参见:
LibraryThing Blog: Google Book Search … on LibraryThing (2007-9-17)
http://www.librarything.com/blog/2007/09/google-book-search-on-librarything.php

Google图书搜索成为世界OPAC? (2006-8-25)
/posts/2006/0825/826
Google的《莎士比亚戏剧全集》 (2006-06-22)
/posts/2006/0622/824
Google合作馆如何处理他们的数字化图书 (2007-04-04)
/posts/2007/0404/482

在OPAC中嵌入LibraryThing提供的相关链接 (2007-04-10)
/posts/2007/0410/480
把图书馆2.0带入你的目录:LibraryThing for Libraries有了第一个用户 (2007-05-15)
/posts/2007/0515/466
thingISBN――用户视角的FRBR化成果 (2006-07-02)
/posts/2006/0702/854

《Google图书搜索的电子书网址》上有6条评论

  1. 提供固定的URL,免费能看到网络图书,是读者永远的期待!

  2. 真是一篇不可多得的报告,不仅有层层分析,还有那么多参考文献,学风可敬!永久的URI也是语义网要实现的基础。

  3. 惭愧,跟着好多自引……
    昨晚上床后想到一些疏漏,刚做了订补。

  4. [主办单位] 中国国家图书馆、苏州独墅湖高等教育区管理办公室
    [承办单位] 苏州独墅湖图书馆、苏州市工业经济联合会
    [举办地点] 苏州独墅湖图书馆
    [举办时间] 2007年11月15日
    致中国企业及相关机构代表:
    信息、知识、智慧——21世纪中国企业(机构)的第一需要!
    继材料、能源之后,信息成为现代社会经济发展的第三大战略性资源和生产要素。超前的信息知识战略、可靠的信息源、高效的信息分析和知识发现工具及方法等等都是企业决胜未来关键所在。
    中国国家图书馆历史悠久、馆藏宏富,多年来一直致力于为国内外各类机构和个人用户提供便捷、经济的文献信息及咨询服务。对于国内大多数企业而言,国家图书馆及全国图书馆体系中的信息资源、专家服务仍是一座尚未关注发现或未及充分利用的“智慧金矿”。
    2007年11月15日,以“基于知识发现的企业创新”为主题的2007年全国图书馆企业信息服务年会(暨第三届国家图书馆企业信息服务年会)将于苏州举办,同时年会还在举办地设有超长体验期(2007年11月15日-30日),支持各界人士对全球优秀信息数据资源的便捷、畅快体验。诚邀阁下的积极参与!
    全国图书馆企业信息服务年会秘书处
    [参会收益]
     分享信息咨询服务专家的经验,掌握为企业创造价值的信息利用与知识发现智慧
     接受竞争情报专家的指导,了解企业运用竞争情报的最新理念、技术和方法
     结识经验丰富的企业信息主管/知识产权总监,切磋企业信息及知识管理的成功经验
     接触各类各行业的全球优秀信息数据库,畅快体验蕴含巨大商业价值的商业及技术信息(超长体验期2007.11.12-11.30)
    [年会联系方法(会务组/苏州秘书处)]
    电话:86-512-62604011,86-512-65931903 传真:86-512-65936881
    EMAIL: info@sdll.cn (报名参会请注明邮件主题为“EIS报名”)
    网站:http://www.nlc.gov..cn ,http://www.sdll.cn即将推出专题版块,敬请关注年会最新信息

    具体信息请咨询年会会务组.

评论已关闭。