开源的链接解析器前端Umlaut

Umlaut是一个开源软件,被称为“链接解析器前端”(link-resolver front end)或“中间层链接解析器”(middle-tier link resolver),而其本身其实就是一个链接解析器,接收OpenURL请求(通常代表学术作品的引用)、回答与引用相关的可用服务信息(最重要的是电子可用性)。与典型的链接解析器产品(如SFX)不同的是,它不管理自己的“知识库”(knowledge base)──有关一个机构拥有的某供应商所提供题名的信息及其链接。它通过SFX API获取这些信息。

Jonathan Rochkind花8个月时间为约翰·霍普金斯大学(JH)的SFX配置了Umlaut作为前端,于1月初上线。选用Umlaut的最初原因是为了方便处理用户界面,更重要的是有了一个增加功能与服务的平台。
目前的功能有:
1、直接链接:在有电子全文的情况下,点击"Find It"后直接链接到文章,而不需要经过菜单层。
2、物理馆藏:在没有电子全文的情况下,直接显示物理馆藏的位置与可得信息(通过ISSN或ISBN匹配,如无则显示OPAC关键词检索链接);同时处理MARC 856字段的链接。
3、相关链接:在侧栏显示相关链接,期刊是Ulrich、WorldCat,图书是Amazon、WorldCat、isbndb(在线购书最优价),只显示有命中结果的链接。[这点对链接服务而言是最重要的,否则足以令用户对其丧失信息]
4、检索开放存取库:以作者/题名关键词检索IndexData的OAISter及开放内容联盟(OCA)的免费访问文本。目前还不完善,因为没有受控的元数据匹配点。
5、集成到OPAC:除全文链接外,侧栏还有“参见”,显示Ulrich、WorldCat、Amazon、isbndb等。

希望增加的功能包括:
· 如Rochester的直接跳到全文
· 增加Google图书搜索
· 连接到OCLC身份(OCLC Identities)
· 使用xISBN/thingISBN
· 用Bowker的ISSN服务强化元数据
· 无全文时集成本地文献传递服务到可选菜单[SFX无此功能?]

Umlaut目前还是一个完善中的平台,Jonathan Rochkind希望有感兴趣者加入作为开发伙伴。对于相关产品的期许是:有人为其它链接解析器提供API,这样也可用Umlaut;未来可以有商品化的链接解析器知识库可以购买。有关技术细节见:http://findit.library.jhu.edu/resolve

Umlaut原是Ross Singer在佐治亚州理工大学(GT)时开发的。Ross Singer觉得JHUmlaut需要改进的是解析速度过慢。但他很高兴JH用上Umlant,也希望由此有更多的SFX及其它链接解析器用户加入此行列。因为GT刚在近四周前撤下此应用,其原因除了他本人的离去外,主要是EBSCO的bug──其OpenURL加了<<SomeIdentifier(具体原因:Since this is injected into the location header via JavaScript (EBSCO sends their OpenURLs via a JavaScript popup), Internet Explorer and Safari don’t escape the URL which causes Mongrel to explode (these are illegal characters in HTTP, after all),而GT有差不多一半的电子资源来自EBSCO。
如果对技术细节感兴趣,Ross Singer此文绝对值得一看(12/17/07 – Resurgens – 1/11/08)。

参见:
Bibliographic Wilderness:(Re-)Introducing the Umlaut (1/14/08)
用(Re-)?对JH来说是引入Umlaut,但对于Umlaut来说,是再一次被引入。

Dilettante’s Ball:12/17/07 – Resurgens – 1/11/08

LCCN永久链接服务

    书蠹精已经报道,我也从同样来源得到消息:美国国会图书馆提供LCCN永久链接服务。通过每条LC书目记录都有的LCCN号,可以直接链接到该记录──一个独立的网页。以后还将增加通过规范记录的LCCN号链接到规范记录的功能。

    基本句法:http://lccn.loc.gov/[LCCN]
如:http://lccn.loc.gov/2003556443
    http://lccn.loc.gov/mm78044693(3位前缀中的空格去掉)
 
    如果要显示MARCXML、MODS或DC格式,则在基本句法中后附限定词,分别是:
http://lccn.loc.gov/[LCCN]/marcxml
http://lccn.loc.gov/[LCCN]/mods
http://lccn.loc.gov/[LCCN]/dc

    上月看“LC书目记录转换工具”的时候,琢磨其句法还很费了一番功夫,可作对比:
http://lcweb2.loc.gov:8081/diglib/admin/test/sru.xml?stdID=[LCCN/ISBN/ISSN]&stylesheet=[样式表名称]
    作为一个检索工具(Search LC Catalog by Standard ID),多了ISBN/ISSN的途径,显示格式也更多些。

    LCCN永久链接服务的作用?据其FAQ:
1、LCCN永久链接是LC联机目录中书目记录的永久URL,使用LC赋予书目与规范记录的识别号──LCCN构造链接。
2、LCCN永久链接提供一种引用与链接LC联机目录中书目记录的简单途径,可在……电子邮件、博客、数据库、网页、数字文档等中使用。

    OCLC早已在WorldCat.org的图书记录页面加上了自己的链接,用的也是自己的控制号。句法:http://worldcat.org/oclc/[OCLC号]
    再早,LibraryThing也可用类似的方法提供链接。记得当时还有一位博主在与网友讨论推荐图书的时候选用哪个链接的问题。
    LC的加入,意味着大家又多了一个选择。只是目前可以从永久链接页面链接到LC联机目录看馆藏情况,但联机目录中还没有显示这个永久链接──对一般用户使用还是个障碍。
  
via MARC Forum:
New LC Permalink Service in production / Ardie Bausenbach (Thu, 14 Feb 2008)

参见:
书蠹精:美国国会图书馆宣布永久LCCN号链接
Library of Congress: LCCN Permalink Frequently Asked Questions
LC书目记录转换工具 (2008-01-23)

OPAC使用统计

    要改进OPAC,直接对OPAC的使用情况进行统计分析,有时比做读者问卷调查更重要。
    记得上交大做过读者对OPAC的调查,结果反应还不错。我以为那是因为国内的网上书店没有Amazon那么出色,豆瓣也不似LibraryThing那般整合众多书目信息、经挖掘整理后可用于OPAC。如果有功能强大的参照物,结论应当有所不同。
    keso曾经有文题为“不要听用户的”:“Jakob Nielsen的可用性第一准则,就是不要听用户的……苹果的乔布斯相信,用户的需求不是他自己发现的,而是你替他发现的。在iPod出来之前,没人知道自己需要一个iPod。”,豆瓣的“杨勃相信数据,相信用户怎么做比他们怎么说更本质。”“一件有创造性的工作,在很大程度上不是满足用户已有的需求,而是创造尚不存在的需求。你怎么可能指望用户对自己尚未意识到的需求,提供有价值的看法呢?”
    斯塔夫里阿诺斯在《全球通史》(北京大学出版社,2006年第2版)中举过类似的例子:“不是存在于本世纪(指20世纪)初的对汽车的需求创造了今天巨大的汽车制造业,而是制造廉价的T型“福特”牌汽车的能力刺激了现代对汽车的大量需求。”(下册,p487)

    LibraryThing的Tim Spalding在NGC4Lib邮件组中征求OPAC中的推荐、标签等的点击数据。英国Huddersfield大学图书馆的David Pattern提供了一份很详细的数据,在最近12个月的总共2,055,707次关键词检索中,他所提供的OPAC新功能的点击次数及所占百分比[可以与一年前的数据对比:If you build it, will they come? (part 2)]:

62,410 (3.0%) 拼写建议("Did you mean?") [日均171:126]
33,709 (1.6%) 借阅参考("People who borrowed this, also borrowed") [日均92:70]
 4,131 (0.2%) 其他版本(xISBN/ThingISBN)(数月前停用xISBN)[日均11:16]
 2,058 (0.1%) 关键词组合建议
   381 (0.02%) 推荐("We think you might be interested in")

“关键词组合建议”是在用户只输入1-2个关键词时,根据之前所有用户关键词组合检索记录,提供多至4个其他关键词[保存检索记录,加以统计分析,进而利用]。“推荐”则是在用户登录图书馆帐户的情况下,向其提供的个性化建议。这两项功能推出不久[不知是不合用,还是用户没有注意到]。

    David还提供了各类关键词的检索数据、不同命中结果量数据(其中21.4%无命中)、检索所用关键词数量,并说明了他暂时还没有统计的数据,如浏览检索结果详细页面的情况。[是否点击结果,从某种程度上说明结果是否真正是检索者想要的]

    Emory大学图书馆的Selden Deemer提供了一份该馆2008年1月不同检索途径的检索数据,尽管不合乎Tim的要求,可谓文不对题,但对于了解一般OPAC的使用也是有价值的。统计分为检索与浏览两部分,合计:检索110,973,浏览5,263[不足5%]。不同检索途径的详细数据:
General         50,997
Title           16,994
Author          13,951
Periodical       4,798
Subject          3,999
Series             223
Other           20,011
    并说明无命中结果的情况占20%(关键词)到50%(丛编)。

    结果发布,却引来砖头无数,其中最重要的一点是认为没有对用户加以区分:哪些类型的用户使用哪些检索途径,是馆员用的还是一般用户用的。
    我原以为馆员在所有用户中所占比例极小,对统计结果的影响应该是微乎其微的,但从Texas A&M大学图书馆的Bennett Claire Ponsford提供的按馆员与公众区分的OPAC使用统计(OPAC usage stats)来看,某些检索途径馆员使用占所有使用量的比例相当大,甚至远超公众使用量(如索书号浏览、题名前方一致检索),因而足以影响统计分析。

    中国用户的OPAC使用数据又有什么样的特点呢?老拿国外数据说事儿,也是无奈之举啊。