LibraryThing免费提供百万图书封面

    LibraryThing在8月初收录图书超过了三千万(册,愈350万种),而用户上载的图书封面也超过了一百万,于是Tim Spalding秉承一贯的开放数据理念,开始提供图书封面API,面向图书馆、书店及所有人。图书馆OPAC又多了一个封面来源。

    使用该服务要求注册一个LibraryThing帐号,并获取一个Developer Key,然后用ISBN即可获取封面。封面有大(large)、中(medium)、小(small)三个选项,如下为中的例子:
<img src="http://covers.librarything.com/devkey/KEY/medium/isbn/0545010225">

    出于对网站访问压力的控制,LibraryThing要求一个网站每天请求次数不超过10005000次;如果用程序自动获取,每秒还不能多于1个封面。并且不要求回链,还推荐将封面保存下来使用──前提一不批量转让,二不是竞争对手。详见其服务条款(LibraryThing Developer Profile)。

    由于不是所有图书都有ISBN,所以目前可通过ISBN提供的封面为91万多。大概用户提供的封面以通俗作品为多,比较适合公共图书馆,所以在专业图书馆工作的David发现,他试着加了37个封面链接,LibraryThing竟然一个都没有。

    Amazon早就有免费的封面服务,且封面数量更多,还不限制每天的请求数。那么,作为一个社会性编目网站,提供这一服务目的何在呢?Tim的回答是,半推广、半行善。
    由于Amazon提供免费服务的目的是推销,故而服务协议(Amazon Web Services™ Customer Agreement)要求回链(见5.1.7;且不能保留图片,见5.1.11),并可以此获得收益(Join Associates),这对于作为公益机构的图书馆就有所顾忌。
    图书馆如果选择商业封面供应商,需要花钱;如果直接上出版社网站下载封面,则需要花人力。
    LibraryThing一直以来发展不错,因而有信心用一定量的带宽负载提供这样的服务。Tim声称“偶行善”好过Google的“不做恶”(more "Do occasional good" than "Do no evil.")

    最终目的?Tim也很坦诚,希望出版社等能够了解其作用,进而愿意提供高质量的封面等信息,而不仅仅依赖用户提供因而清晰度等不能保证的图片。

    这是LibraryThing提供的第四项Web服务(LibraryThing APIs)。澳大利亚国家书目数据库搜索原型系统(Lucene NBD Search Prototype)就采用了其API,提供LibraryThing的收藏册数及用户评级(星数),显示在Google图书信息之后。

参见:
LibraryThing Blog:  A million free covers from LibraryThing (August 07, 2008)
Catalogablog: Free Covers from LibraryThing (August 11, 2008, Update 12 Aug. 2008)

[update 2008-8-14] LibraryThing已经将请求限制提高到了5000。各方也有积极反应:
· Art Zemon发布了一个简单的用PHP写的LibraryThing封面保存脚本(LibraryThing covers caching script)
· Alejandro Garza提供了Millennium系统使用LibraryThing封面的指导(要求用Millennium Module for Drupal),在留言中有实例(看着也是分面OPAC呢),并说明命中率只有0.18%──因为这是家墨西哥的生命科学图书馆,多是西班牙语图书。
· Library Journal网站上发表了Josh Hadro的文章介绍此事LibraryThing Releases One Million Free Covers

参见:
Thing-ology: More on covers (August 12, 2008)
Cheerful Curmudgeon: Caching Free LibraryThing Book Covers (August 11th, 200)
Stupendous Amazing Library: A million free covers from Library Thing (August 12, 2008)
Library Journal (8/12/2008): LibraryThing Releases One Million Free Covers / Josh Hadro

Google图书搜索的电子书网址

    越来越多的图书被数字化并上网,如果能够在OPAC中揭示出这些电子书的存在,无疑将方便读者利用。要在OPAC中提供链接,首先需要解决的问题是得到这些电子书的网址。Karen Coyle曾设想建立一个转换数据库("switching" database),能够通过LCCN、ISBN、OCLC#及少量书目元数据,获取数字图书的URL(包括Google图书搜索、开放内容联盟OCA及古登堡计划)。除非这些数字化项目本身支持,否则这个大工程可是很棘手的。

    Google图书搜索(GBS)虽则官司缠身,可与之合作的图书馆却在陆续增加,数字化的图书也在不断上网。目前能提供全文阅读的比例不高(美国以外这个比例更低),但能够阅读部分、或者目次也有一定需求,因此增加GBS的链接,对图书馆有了一定的吸引力。

    在近年OPAC的改进过程中,使用亚马逊的信息比较多。除了内容丰富外,技术上的原因主要是亚马逊在有ISBN的情况下,直接用ISBN号作为其标识,可以很方便地构成图书各方面信息的URL,提供链接;另一个原因是亚马逊提供API,可以把封面、书评等内容直接嵌入OPAC的显示页面。而这两点,对GBS似乎都不存在。

    查GBS就会发现,它的图书标识是一长串似乎随机生成的代码,如“5EccAAAACAAJ”,据说是根据数字化时图书的条码号生成的。澳大利亚国家图书馆的LibraryLabs是很少几个链接GBS的OPAC,它规避了特定电子书的URL问题,通过OPAC检索时所用词串检索GBS得到一批图书封面及链接。而一般OPAC需要链接到某一特定版本,没有其标识号无法实现。

    其实GBS不只有一个ID,ISBN、OCLC#都可能是ID (vid, varied id?),这种多重ID的形式,其实对提供链接是一个福音。如前述ID的这本书,是庄子逸、许文霞所译兰开斯特的《通向无纸情报系统》,在GBS中查得到的URL是http://books.google.com/books?id=5EccAAAACAAJ,而用ISBN号的URL是:http://books.google.com/books?vid=7502305424

    美国东密歇根大学在去年十一月就通过OCLC#在OPAC中动态提供GBS的链接(根据是否能获取全文,给出不同的显示文字)。根据用此法得到的数据,仅有约5%有全文,约10%可以看片断。[update 2007-9-28] Wake Forest 大学 Professional Center Library 也采用东密歇根大学的方法提供GBS链接,一个使用OCLC#的实例:http://books.google.com/books?vid=OCLC49284042

    问题在于,无论是ISBN还是OCLC#,都不能保证查到实际上存在的GBS电子书。比如:http://books.google.com/books?id=CV0lHa0j2YAC,该书的ISBN为0802142818,但用http://books.google.com/books?vid=0802142818则没有结果 [2007-9-28更正:用http://books.google.com/books?vid=ISBN0802142818可以检索到。也就是说,使用ISBN时,加上ISBN标识检出可能性较高]。Karen举了另一个例子:http://books.google.com/books?id=MgSoZJLtmGQC。此书在哈佛大学书目中的OCLC#是16730575,但用此号构造出的URL并不存在(Not Found)。关于OCLC#,据说在WorldCat中对数字化图书都会另外给一个OCLC#,如此则原来纸本的OCLC#在这种情况下有用性大大降低。对于大量早期没有ISBN的图书,就只有利用GBS的ID一条途径了。

    LibraryThing的Tim Spalding要获取GBS的ID。因为之前AADL的John Blyberg曾试图用机器人获取,结果被Google封杀,所以Tim想如之前LT做合并同一版本那样,再次依靠群众的力量。他做了一个名为"Google Book Search Search"的小书签(bookmarklet),让LT用户及其他人在访问GBS时使用,以获取GBS的图书ID。由于是不同IP的人在分散访问GBS,或许可以避免被Google封杀——关于此点,Tim没有把握,毕竟是同用一个程序在获取数据。他在早上2点发布GBSS小书签,到晚上10点多发贴时,已有超过300个LT用户装上并开始使用了。
    Tim承诺所有获取的数据将会共享,供图书馆强化自己的OPAC。并设想(有了足够的数据后)在LibraryThing for Libraries中作为免费的部分提供。目前LT用户提供的数据可以在该网站的“Google Book Search Search Data”看到,全部数据的XML文件也可以下载

via: NGC4LIB
Adding links to books in Google Book Search within the OPAC (2007-9-14)
Announcing Google Book Search, um, Search (2007-9-17)

参见:
LibraryThing Blog: Google Book Search … on LibraryThing (2007-9-17)
http://www.librarything.com/blog/2007/09/google-book-search-on-librarything.php

Google图书搜索成为世界OPAC? (2006-8-25)
/posts/20060825164528.html
Google的《莎士比亚戏剧全集》 (2006-06-22)
/posts/20060622194146.html
Google合作馆如何处理他们的数字化图书 (2007-04-04)
/posts/20070405050354.html

在OPAC中嵌入LibraryThing提供的相关链接 (2007-04-10)
/posts/20070410205431.html
把图书馆2.0带入你的目录:LibraryThing for Libraries有了第一个用户 (2007-05-15)
/posts/20070515214513.html
thingISBN――用户视角的FRBR化成果 (2006-07-02)
/posts/20060702212245.html

你不知道在LibraryThing上可以做的12件事

    LibraryThing刚庆祝了自己的两周岁生日。尽管Tim自己说,在网站刚开张的一周中,他根本未曾想到过“社会化功能”,但LT现在的确是社会化功能相当强的网站。
    Tim认为,社会化软件90%是社会,10%是软件,是You造就了它。Tim的确善于利用“群众的力量”,除了书目信息本身,以及加标签、评论/评级、上传封面/作者图片等常见的用户贡献内容外,他还让用户手工做集中同一作品不同版本的工作(图书馆界谓之FRBR化)。
    在两周年庆的博文Happy birthday to us!中,LT的图书馆员Abby除了告诉我们一些LT的统计数字外,还告诉了我们其他一些在LT上可以做的事,显示了其更多社会化及其他Web 2.0功能:

1. Find out what your friends are reading
通过Connection News,得知朋友近期增加或评级、评论的图书

2. Swap books
LT与10个图书交换网站整合,可以看到交换图书的供求信息

3. Unsuggestions
LT通过计算用户收录图书的相似度,推出“推荐功能”,类似于亚马逊的“买本书者还买的其他书”。当然用户也可以“推荐”。同样通过计算,以及用户提交的“不推荐”,LT还有“不推荐”功能。不知道除了好玩,计算出来的“不推荐”是否还有其他作用?

4. Organizations use LibraryThing
居然还有不少机构在使用LT,难不成把LT当成自己的OPAC?举的例子有:乌干达税务局,休斯顿的天气博物馆,柬埔寨美国传统博物馆与纪念图书馆,圣彼得堡Naboko博物馆,纽约市的卡通艺术博物馆。据称还有教堂、学校、商业机构等。

5. LT Authors
一些图书作者在LT上陈列自己的作品。目前有20位最流行LT作者榜,第20名正是Tim的妻子,所以博文中声称,如果她降一位,那么LT流行作者榜将会显示21位 🙂

6. Photomosaics
可以把自己收藏图书的封面拼成一张图,或做成一张招贴画

7. Blog widgets
可以在自己博客上显示自己的LT收藏(blog widgets),或者在博客中做一个搜索框(search widget),让他人可以通过博客搜索自己的LT收藏。

8. Author gallery
作者画廊显示收藏图书的作者像

9. LibraryThing in your language
LT目前有30种语言的版本,而翻译全部由用户志愿完成!LT的吸引力可见一斑。

10. Statistics
LT的统计功能中有一项,列出哪些书只有一位其他成员与你共有,或许他/她正是你的心灵之友。

11. Helpers log
可以看到LT成员在网站上所做的贡献,包括合并作品、合并作者[用图书馆学术语,就是作者名称规范]、合并标签[用图书馆学术语,就是主题规范了?]、加作者图片、加作者链接及其他编辑活动。最多可以看到三天的信息。据称在周年那天前24小时内有1860项,参与度的确够强。

12. Buy Swag
LT在咖啡出版社网站上有一家商店,卖有LT标识的T恤、包袋、帽子,以及钮扣、磁贴、鼠标垫、杯子之类小玩艺。