WorldCat 45周年 & OCLC API访问每天300万

上月OCLC的WorldCat庆祝了它的45周年1971年8月26日,当时名为OCLC联机联合目录的WorldCat在那天接受了来自俄亥俄大学编目员联机编目的133种图书。45年后,WorldCat已收录3.8亿多条记录、涉及世界各国图书馆24亿多件馆藏。资料类型包括图书、连续出版物、乐谱、地图、录音、视频资料、DVD、计算机文档、电子书、数字资源、混合资料等,涉及491种语言文字,其中62%为非英语。看WorldCat记录实时增长(Watch WorldCat Grow),最近加入的是哪条记录,哪个机构上传?

也是在上月,OCLC的API每天点击超过了300万。OCLC在2003年开始Open WorldCat项目,试验结束时每天的点击是4千,已被认为相当成功。之后OCLC开始提供API,目前有十多种,超过4500机构个人申请了API Key,用这些API开发的应用超过了100种。
用得最多的是WorldCat Search API,有超过50种应用,使用机构超过500家,贡献了约一半的点击。
现在甚至可以通过API,用手机向WorldCat提交简编记录,这就是供非馆员使用的Bib It,采用的是WorldCat Metadata API。

Bib It

相关:
OCLC News release: Celebrating 45 years of WorldCat (DUBLIN, Ohio, 26 August 2016)
Next: 3 million knocks on library doors every day (2016-8-3)
参见:OCLC的Open WorldCat计划(2004-10-28)

——— OCLC的Web Service一览Gallery) ———
– Article Exchange API
– Classify
– FAST API
– OpenURL Gateway
– QuestionPoint knowledge base API
– Terminology Services
– VIAF API
– WMS Acquisitions API
– WMS Collection Management API
– WorldCat Basic API
– WorldCat Discovery API
– WorldCat Identities
– WorldCat Metadata API
– WorldCat Recommender Service
– WorldCat Registry
– WorldCat Search API
– WorldCat knowledge base API
– xID API

图书封面来源

    Catalogablog博主David想找一个好的图书封面来源,他所在馆是专业馆,试过LibraryThing命中率仅1%。在博客上求助后,有网友留言推荐BookChaser.com的封面查找工具(Covers Lookup Tool)。
    该工具使用ISBN检索,通过不同来源的API将图书封面集成在一个页面,似乎并没有提供自己的API。首页说明服务符合Amazon Web Service和Google’s Book API的要求,LibraryThing API使用得到授权。
    包括如下服务:
LibraryThing’s covers API (http://www.librarything.com/services/)
OpenLibrary’s JSON API (http://openlibrary.org/dev/docs/api)
Amazon’s Associates Web Service (http://aws.amazon.com/)
Google’s Books API (http://code.google.com/apis/books/)
Worldcat’s xISBN (http://xisbn.worldcat.org/)
    检索结果看,Amazon一直是“Error 500 – Internal server error”,或许与使用协议变化有关。另外,还有封面来自网上书店:
Powell’s Books(http://www.powells.com/

    BookChaser.com(http://www.bookchaser.com/)目前提供四个图书信息一站式查找工具,分别是:
1. Editions Lookup tool (March 24, 2008).
Lets you find other editions of a book via different services.

2. Covers lookup tool (August 14, 2008).
Lets you find covers for a book from different services.

3. BookInfo lookup tool (August 16, 2008).
Lets you find book information for a book from different services.

4. ISBN Analysis tool (October 17, 2008).
Compares xISBN-like services. 

约翰·霍普金斯大学的Umlaut应用

约翰·霍普金斯大学(JHU)图书馆新近在该馆链接解析器SFX和OPAC上增加了一些新功能,提供链接到公开访问的全文图书,链接到图书预览/片断,而且在页面中嵌入“书内搜索”。这些功能由Umlaut链接解析器前端实施。使用Umlaut的JS帮助器代码,可以方便地在OPAC中嵌入Umlaut的内容。JHU使用的集成系统是Horizon。
嵌入OPAC页面不难,但为实现前述功能,在写代码上还是花了不少功夫,目前仍待改进。并且所用的有些服务有了新的API,也需要据以更新Umlaut。
现在的代码不少由暑期实习的研究生Jason Ronallo所写。看他的自我介绍可知,本项目由Ruby写成。
目前Rubyforge上的Umlaut项目页面尚未发布任何文件,有关内容发布在Code4Lib的wiki上。
自半年前JHU的Jonathan Rochkind“重新”启用Umlaut,一直努力推介Umlaut,希望感兴趣共同完善。目前Umlaut功能依赖于SFX实现,Rochkind也希望可以用于其他链接解析器。

目前用到的服务包括:
· 亚马逊
· Google图书搜索(GBS)
· Internet Archive (IA)
· HathiTrust(http://www.hathitrust.org)
· OCLC的身份档(WorldCat Identities)(作者信息)
· isbndb.com(图书比价网站)
封面图像来自:
亚马逊
GBS
Open Library
CoverThing(来自LibraryThing

新功能的实现依赖于多项外部服务,因而速度不能保证。但由于采用Ajax逐渐载入获取的数据,用户可以先看基本书目信息,外部数据在loading…完成后逐渐显示,使用体验还不错。
图书馆收藏的图书,可公开访问的毕竟不多,且多半是过了版权保护期的,在美国是1923年以前的旧书;而有“书内搜索”与片断预览的,则主要是新书,并且据Rochkind所知,数量相当大。所以他认为后者会更受用户欢迎。二者结合,不知占馆藏几何?无论如何,集成众多图书信息的OPAC,增值不少。

下面是Rochkind举的若干例子。

一、链接OA的数字化图书:
· GBS:使用LCCN、OCLC号及ISBN匹配。不知目前所据为何,未来将改用GBS的Data API。
GBS与IA链接实例:Mark Twain’s letters

· Internet Archive:目前使用作者/题名匹配,未来将改用出现不久的OpenLibrary API。想来目前的“参见”,链接到同书的各种不同版本,就是通过作者/题名匹配的。
IA链接实例:Prison memoirs of an anarchist

· HathiTrust:与GBS一样,使用LCCN、OCLC号及ISBN匹配。
只在GBS没有时才显示。Rochkind指出,有些GBS不提供全文的,HathiTrust提供全文。
可惜他所举的例子Chaucer’s Canterbury tales(SFX链接)到HathiTrust后,同样显示由于版权限制不能看全文──后面的多个例子使我相信,HathiTrust显示全文是有访问IP限制的
在OPAC中,Chaucer’s Canterbury tales并没有显示HathiTrust链接,因为在该馆的这条MARC记录中,没有LCCN、OCLC号及ISBN。或许可算书目数据质量影响用户体验的一个歪例吧

二、嵌入书内搜索:
· 亚马逊和HathiTrust实例:Vision on fire : Emma Goldman on the Spanish Revolution
由于版权保护,HathiTrust说明有18个检索结果,但并不显示相关内容。
亚马逊的结果则有内容片断,黑体显示检索词,链接到原文需登录。

· GBS和HathiTrust实例,同上:Mark Twain’s letters
GBS检索结果显示片断,用黄底突出显示搜索词。此书在美国属开放存取,但在中国是“摘录视图”
HathiTrust同样说明由于版权限制,不显示相关内容。

三、作者信息:
根据OCLC书目号,链接到WorldCat Identities。
Umlaut具有显示维基百科相关页面的功能,但由于Identities会包含维基百科页面,所以JHU目前关闭了这个功能。

四、IA有声图书:
目前使用的IA搜索API会显示是否带有声书,而Open Library的API并没有此项功能。所以对有声图书,未来仍将沿用原API。
实例见:The adventures of Tom Sawyer

所有截图见:约翰·霍普金斯大学的Umlaut应用

via Bibliographic Wilderness
Digital Book features in link resolver and opac (2008-10-16)

Umlaut的相关信息:
相关代码说明:Bibliographic Wilderness: Umlaut APIs (2008-10-2)
内容在Code4Lib的wiki:Umlaut partial html API javascript helper
Rubyforge的Umlaut项目页面
Bibliographic Wilderness: Rethinking the role of an OpenURL link resolver (2008-9-25)
开源的链接解析器前端Umlaut (2008-03-01)

关于HathiTrust:
图有其表:大象来了 (2008-10-14)

关于WorldCat Identities:
规范档2.0:WorldCat身份档 (2007-02-14)

关于OpenLibrary API:
Open Library也提供API (2008-5-11)

关于GBS API:
用Google图书搜索API增强OPAC (2008-03-16)
在OPAC中加入Google图书信息 (2008-06-06)
在图书馆OPAC预览Google图书 (2008-09-23)

关于书内搜索:
Google与Amazon书内搜索比较 (2005-05-07)
亚马逊“书内搜索”扩展功能 (2005-05-18)