约翰·霍普金斯大学的Umlaut应用

约翰·霍普金斯大学(JHU)图书馆新近在该馆链接解析器SFX和OPAC上增加了一些新功能,提供链接到公开访问的全文图书,链接到图书预览/片断,而且在页面中嵌入“书内搜索”。这些功能由Umlaut链接解析器前端实施。使用Umlaut的JS帮助器代码,可以方便地在OPAC中嵌入Umlaut的内容。JHU使用的集成系统是Horizon。
嵌入OPAC页面不难,但为实现前述功能,在写代码上还是花了不少功夫,目前仍待改进。并且所用的有些服务有了新的API,也需要据以更新Umlaut。
现在的代码不少由暑期实习的研究生Jason Ronallo所写。看他的自我介绍可知,本项目由Ruby写成。
目前Rubyforge上的Umlaut项目页面尚未发布任何文件,有关内容发布在Code4Lib的wiki上。
自半年前JHU的Jonathan Rochkind“重新”启用Umlaut,一直努力推介Umlaut,希望感兴趣共同完善。目前Umlaut功能依赖于SFX实现,Rochkind也希望可以用于其他链接解析器。

目前用到的服务包括:
· 亚马逊
· Google图书搜索(GBS)
· Internet Archive (IA)
· HathiTrust(http://www.hathitrust.org)
· OCLC的身份档(WorldCat Identities)(作者信息)
· isbndb.com(图书比价网站)
封面图像来自:
亚马逊
GBS
Open Library
CoverThing(来自LibraryThing

新功能的实现依赖于多项外部服务,因而速度不能保证。但由于采用Ajax逐渐载入获取的数据,用户可以先看基本书目信息,外部数据在loading…完成后逐渐显示,使用体验还不错。
图书馆收藏的图书,可公开访问的毕竟不多,且多半是过了版权保护期的,在美国是1923年以前的旧书;而有“书内搜索”与片断预览的,则主要是新书,并且据Rochkind所知,数量相当大。所以他认为后者会更受用户欢迎。二者结合,不知占馆藏几何?无论如何,集成众多图书信息的OPAC,增值不少。

下面是Rochkind举的若干例子。

一、链接OA的数字化图书:
· GBS:使用LCCN、OCLC号及ISBN匹配。不知目前所据为何,未来将改用GBS的Data API。
GBS与IA链接实例:Mark Twain’s letters

· Internet Archive:目前使用作者/题名匹配,未来将改用出现不久的OpenLibrary API。想来目前的“参见”,链接到同书的各种不同版本,就是通过作者/题名匹配的。
IA链接实例:Prison memoirs of an anarchist

· HathiTrust:与GBS一样,使用LCCN、OCLC号及ISBN匹配。
只在GBS没有时才显示。Rochkind指出,有些GBS不提供全文的,HathiTrust提供全文。
可惜他所举的例子Chaucer’s Canterbury tales(SFX链接)到HathiTrust后,同样显示由于版权限制不能看全文──后面的多个例子使我相信,HathiTrust显示全文是有访问IP限制的
在OPAC中,Chaucer’s Canterbury tales并没有显示HathiTrust链接,因为在该馆的这条MARC记录中,没有LCCN、OCLC号及ISBN。或许可算书目数据质量影响用户体验的一个歪例吧

二、嵌入书内搜索:
· 亚马逊和HathiTrust实例:Vision on fire : Emma Goldman on the Spanish Revolution
由于版权保护,HathiTrust说明有18个检索结果,但并不显示相关内容。
亚马逊的结果则有内容片断,黑体显示检索词,链接到原文需登录。

· GBS和HathiTrust实例,同上:Mark Twain’s letters
GBS检索结果显示片断,用黄底突出显示搜索词。此书在美国属开放存取,但在中国是“摘录视图”
HathiTrust同样说明由于版权限制,不显示相关内容。

三、作者信息:
根据OCLC书目号,链接到WorldCat Identities。
Umlaut具有显示维基百科相关页面的功能,但由于Identities会包含维基百科页面,所以JHU目前关闭了这个功能。

四、IA有声图书:
目前使用的IA搜索API会显示是否带有声书,而Open Library的API并没有此项功能。所以对有声图书,未来仍将沿用原API。
实例见:The adventures of Tom Sawyer

所有截图见:约翰·霍普金斯大学的Umlaut应用

via Bibliographic Wilderness
Digital Book features in link resolver and opac (2008-10-16)

Umlaut的相关信息:
相关代码说明:Bibliographic Wilderness: Umlaut APIs (2008-10-2)
内容在Code4Lib的wiki:Umlaut partial html API javascript helper
Rubyforge的Umlaut项目页面
Bibliographic Wilderness: Rethinking the role of an OpenURL link resolver (2008-9-25)
开源的链接解析器前端Umlaut (2008-03-01)

关于HathiTrust:
图有其表:大象来了 (2008-10-14)

关于WorldCat Identities:
规范档2.0:WorldCat身份档 (2007-02-14)

关于OpenLibrary API:
Open Library也提供API (2008-5-11)

关于GBS API:
用Google图书搜索API增强OPAC (2008-03-16)
在OPAC中加入Google图书信息 (2008-06-06)
在图书馆OPAC预览Google图书 (2008-09-23)

关于书内搜索:
Google与Amazon书内搜索比较 (2005-05-07)
亚马逊“书内搜索”扩展功能 (2005-05-18)