Blacklight:佛吉尼亚大学的开源OPAC

    越来越多的图书馆开始用开源软件开发新一代OPAC,佛吉尼亚大学图书馆是又一个用Solr做此尝试的。
    佛吉尼亚大学图书馆正在做的开源OPAC,名为Blacklight。采用Solr索引与检索,带一个可配置的Ruby on Rails前端,可以索引、检索及提供MARC记录和若干种XML文件(包括TEI、EAD及GDMS)的分面浏览。
    项目说明:“用ruby写的新一代图书馆目录,使用solr作搜索引擎。只需输出MARC记录,用所提供的脚本做索引,启用ruby on rails,就可实现分面浏览。”
    佛吉尼亚大学图书馆的实例显示有大量的数据(4,436,931条书目记录,10,143条数字图书馆记录)。不过因为还处于Pre-Alpha阶段,所以只能看个场面而已。

    比较有意思的是这个分面显示的结果,居然已经收录了创作于193世纪的作品:

    自己在处理书目信息时,时常有发现一个错误、而后查询发现一批错误的经历。新型OPAC对于书目数据的深层次揭示,让以前隐藏着的编目错误自动暴露在光天化日之下。曾见到某个编目员谈使用新型OPAC的感受,说是一下子显露的大量错误让编目员为更正而疲于奔命。

Via eggott, Mark: New Blacklight OPAC from Virginia (March 02, 2008)

使用solr的OPAC参见:
二小时建立分面OPAC (2007-04-08)
/posts/2007/0408/481

开源OPAC发布:VuFind (2007-07-23)
/posts/2007/0723/435

又一个开源OPAC——Fac-Back-OPAC (2007-10-07)
/posts/2007/1007/415

LCCN永久链接服务

    书蠹精已经报道,我也从同样来源得到消息:美国国会图书馆提供LCCN永久链接服务。通过每条LC书目记录都有的LCCN号,可以直接链接到该记录──一个独立的网页。以后还将增加通过规范记录的LCCN号链接到规范记录的功能。

    基本句法:http://lccn.loc.gov/[LCCN]
如:http://lccn.loc.gov/2003556443
    http://lccn.loc.gov/mm78044693(3位前缀中的空格去掉)
 
    如果要显示MARCXML、MODS或DC格式,则在基本句法中后附限定词,分别是:
http://lccn.loc.gov/[LCCN]/marcxml
http://lccn.loc.gov/[LCCN]/mods
http://lccn.loc.gov/[LCCN]/dc

    上月看“LC书目记录转换工具”的时候,琢磨其句法还很费了一番功夫,可作对比:
http://lcweb2.loc.gov:8081/diglib/admin/test/sru.xml?stdID=[LCCN/ISBN/ISSN]&stylesheet=[样式表名称]
    作为一个检索工具(Search LC Catalog by Standard ID),多了ISBN/ISSN的途径,显示格式也更多些。

    LCCN永久链接服务的作用?据其FAQ:
1、LCCN永久链接是LC联机目录中书目记录的永久URL,使用LC赋予书目与规范记录的识别号──LCCN构造链接。
2、LCCN永久链接提供一种引用与链接LC联机目录中书目记录的简单途径,可在……电子邮件、博客、数据库、网页、数字文档等中使用。

    OCLC早已在WorldCat.org的图书记录页面加上了自己的链接,用的也是自己的控制号。句法:http://worldcat.org/oclc/[OCLC号]
    再早,LibraryThing也可用类似的方法提供链接。记得当时还有一位博主在与网友讨论推荐图书的时候选用哪个链接的问题。
    LC的加入,意味着大家又多了一个选择。只是目前可以从永久链接页面链接到LC联机目录看馆藏情况,但联机目录中还没有显示这个永久链接──对一般用户使用还是个障碍。
  
via MARC Forum:
New LC Permalink Service in production / Ardie Bausenbach (Thu, 14 Feb 2008)

参见:
书蠹精:美国国会图书馆宣布永久LCCN号链接
Library of Congress: LCCN Permalink Frequently Asked Questions
LC书目记录转换工具 (2008-01-23)

OPAC使用统计

    要改进OPAC,直接对OPAC的使用情况进行统计分析,有时比做读者问卷调查更重要。
    记得上交大做过读者对OPAC的调查,结果反应还不错。我以为那是因为国内的网上书店没有Amazon那么出色,豆瓣也不似LibraryThing那般整合众多书目信息、经挖掘整理后可用于OPAC。如果有功能强大的参照物,结论应当有所不同。
    keso曾经有文题为“不要听用户的”:“Jakob Nielsen的可用性第一准则,就是不要听用户的……苹果的乔布斯相信,用户的需求不是他自己发现的,而是你替他发现的。在iPod出来之前,没人知道自己需要一个iPod。”,豆瓣的“杨勃相信数据,相信用户怎么做比他们怎么说更本质。”“一件有创造性的工作,在很大程度上不是满足用户已有的需求,而是创造尚不存在的需求。你怎么可能指望用户对自己尚未意识到的需求,提供有价值的看法呢?”
    斯塔夫里阿诺斯在《全球通史》(北京大学出版社,2006年第2版)中举过类似的例子:“不是存在于本世纪(指20世纪)初的对汽车的需求创造了今天巨大的汽车制造业,而是制造廉价的T型“福特”牌汽车的能力刺激了现代对汽车的大量需求。”(下册,p487)

    LibraryThing的Tim Spalding在NGC4Lib邮件组中征求OPAC中的推荐、标签等的点击数据。英国Huddersfield大学图书馆的David Pattern提供了一份很详细的数据,在最近12个月的总共2,055,707次关键词检索中,他所提供的OPAC新功能的点击次数及所占百分比[可以与一年前的数据对比:If you build it, will they come? (part 2)]:

62,410 (3.0%) 拼写建议("Did you mean?") [日均171:126]
33,709 (1.6%) 借阅参考("People who borrowed this, also borrowed") [日均92:70]
 4,131 (0.2%) 其他版本(xISBN/ThingISBN)(数月前停用xISBN)[日均11:16]
 2,058 (0.1%) 关键词组合建议
   381 (0.02%) 推荐("We think you might be interested in")

“关键词组合建议”是在用户只输入1-2个关键词时,根据之前所有用户关键词组合检索记录,提供多至4个其他关键词[保存检索记录,加以统计分析,进而利用]。“推荐”则是在用户登录图书馆帐户的情况下,向其提供的个性化建议。这两项功能推出不久[不知是不合用,还是用户没有注意到]。

    David还提供了各类关键词的检索数据、不同命中结果量数据(其中21.4%无命中)、检索所用关键词数量,并说明了他暂时还没有统计的数据,如浏览检索结果详细页面的情况。[是否点击结果,从某种程度上说明结果是否真正是检索者想要的]

    Emory大学图书馆的Selden Deemer提供了一份该馆2008年1月不同检索途径的检索数据,尽管不合乎Tim的要求,可谓文不对题,但对于了解一般OPAC的使用也是有价值的。统计分为检索与浏览两部分,合计:检索110,973,浏览5,263[不足5%]。不同检索途径的详细数据:
General         50,997
Title           16,994
Author          13,951
Periodical       4,798
Subject          3,999
Series             223
Other           20,011
    并说明无命中结果的情况占20%(关键词)到50%(丛编)。

    结果发布,却引来砖头无数,其中最重要的一点是认为没有对用户加以区分:哪些类型的用户使用哪些检索途径,是馆员用的还是一般用户用的。
    我原以为馆员在所有用户中所占比例极小,对统计结果的影响应该是微乎其微的,但从Texas A&M大学图书馆的Bennett Claire Ponsford提供的按馆员与公众区分的OPAC使用统计(OPAC usage stats)来看,某些检索途径馆员使用占所有使用量的比例相当大,甚至远超公众使用量(如索书号浏览、题名前方一致检索),因而足以影响统计分析。

    中国用户的OPAC使用数据又有什么样的特点呢?老拿国外数据说事儿,也是无奈之举啊。