香港科技大学的Scriblio实验目录

    昨天得知香港科技大学正在开发一个新OPAC,据说花了不少时间,比如处理汉字什么的。
    今天前去细看,名为实验目录(experimental catalog)、新一代(next generation)、Beta版,基于开源的Scriblio,Web2.0技术特征──分面搜索、交互标签云、用户评论与RSS种子。
    首页下方用户可以提交评论,目前唯一的评论是愚人节留下的,似乎颇留恋原来的界面。不知是留言的是馆员还是用户,如果是用户又是什么类型的用户,意见是:
It is a good and easy to use search method. To make it perfect, I think adding the following is better:
1. Check box to let user select aurthor, title, subject or all (uncheck all)
2. A easy finding box for refining search

    试用后(截图),印象最深的是输入检索词过程中的动态提示。不知道是不是接受了上述留言的意见,与一般只显示前方一致的词串不同,提示词也是分面的──除了一般的search for之外,还有Title、Title begin with和Author begin with,很有新意。中文似乎没有输入提示。

    检索结果上方有到港书网(HKAll)、WorldCat和Google学术搜索的链接。
    检索结果一览的分面依次是:Format, Self Location, Author, Title, Subject, Publication Year。其中主题与出版年以标签云形式展示。
    一览中直接显示详细信息,有封面、标签(似乎也来自主题?)及输入到RefWorks、WebBridge等链接──预约及详细信息链至原目录。馆藏位置链接到图书馆布局图示,用动态GIF指示详细的位置。

    检索结果的相关性似有不足──最近特别关注这一点。也没有看到显示排序选择。

关于Scriblio
    基于博客软件WordPress的开源OPAC,原名WPOPAC,曾获开源软件的2006梅隆信息协作奖,是图书馆界唯一获奖者(参见“从获奖看国外流行的开源软件”(2006-12-07))。
    名为FISH的开源OPAC也借鉴WPOpac的方法,将MARC数据转入MySQL数据库,然后生成一系列动态网页(参见“开源OPAC也精彩”(2007-01-14))。由于有导出过程,必然有数据如何与ILS同步与更新问题──但Casey Maison奋斗经久,终于将其替代Plymouth州立大学馆原有OPAC,其实用性无须置疑。
    3月中Google发布图书API,可以把Google图书的信息(全文可看、部分可看、只有书目)动态显示在OPAC上,Google的宣传博文即举Scriblio为应用实例之一──另外的图书馆实例是通过Ex Libris的Primo或SFX实现的(参见“用Google图书搜索API增强OPAC”(2008-03-16))。

    如果对Scriblio感兴趣,其网站(http://about.scriblio.net/)有具体实施所需信息,包括软件下载、使用与安装配置(wiki)等。

Blacklight:佛吉尼亚大学的开源OPAC

    越来越多的图书馆开始用开源软件开发新一代OPAC,佛吉尼亚大学图书馆是又一个用Solr做此尝试的。
    佛吉尼亚大学图书馆正在做的开源OPAC,名为Blacklight。采用Solr索引与检索,带一个可配置的Ruby on Rails前端,可以索引、检索及提供MARC记录和若干种XML文件(包括TEI、EAD及GDMS)的分面浏览。
    项目说明:“用ruby写的新一代图书馆目录,使用solr作搜索引擎。只需输出MARC记录,用所提供的脚本做索引,启用ruby on rails,就可实现分面浏览。”
    佛吉尼亚大学图书馆的实例显示有大量的数据(4,436,931条书目记录,10,143条数字图书馆记录)。不过因为还处于Pre-Alpha阶段,所以只能看个场面而已。

    比较有意思的是这个分面显示的结果,居然已经收录了创作于193世纪的作品:

    自己在处理书目信息时,时常有发现一个错误、而后查询发现一批错误的经历。新型OPAC对于书目数据的深层次揭示,让以前隐藏着的编目错误自动暴露在光天化日之下。曾见到某个编目员谈使用新型OPAC的感受,说是一下子显露的大量错误让编目员为更正而疲于奔命。

Via eggott, Mark: New Blacklight OPAC from Virginia (March 02, 2008)

使用solr的OPAC参见:
二小时建立分面OPAC (2007-04-08)
/posts/2007/0408/481

开源OPAC发布:VuFind (2007-07-23)
/posts/2007/0723/435

又一个开源OPAC——Fac-Back-OPAC (2007-10-07)
/posts/2007/1007/415

开源的链接解析器前端Umlaut

Umlaut是一个开源软件,被称为“链接解析器前端”(link-resolver front end)或“中间层链接解析器”(middle-tier link resolver),而其本身其实就是一个链接解析器,接收OpenURL请求(通常代表学术作品的引用)、回答与引用相关的可用服务信息(最重要的是电子可用性)。与典型的链接解析器产品(如SFX)不同的是,它不管理自己的“知识库”(knowledge base)──有关一个机构拥有的某供应商所提供题名的信息及其链接。它通过SFX API获取这些信息。

Jonathan Rochkind花8个月时间为约翰·霍普金斯大学(JH)的SFX配置了Umlaut作为前端,于1月初上线。选用Umlaut的最初原因是为了方便处理用户界面,更重要的是有了一个增加功能与服务的平台。
目前的功能有:
1、直接链接:在有电子全文的情况下,点击"Find It"后直接链接到文章,而不需要经过菜单层。
2、物理馆藏:在没有电子全文的情况下,直接显示物理馆藏的位置与可得信息(通过ISSN或ISBN匹配,如无则显示OPAC关键词检索链接);同时处理MARC 856字段的链接。
3、相关链接:在侧栏显示相关链接,期刊是Ulrich、WorldCat,图书是Amazon、WorldCat、isbndb(在线购书最优价),只显示有命中结果的链接。[这点对链接服务而言是最重要的,否则足以令用户对其丧失信息]
4、检索开放存取库:以作者/题名关键词检索IndexData的OAISter及开放内容联盟(OCA)的免费访问文本。目前还不完善,因为没有受控的元数据匹配点。
5、集成到OPAC:除全文链接外,侧栏还有“参见”,显示Ulrich、WorldCat、Amazon、isbndb等。

希望增加的功能包括:
· 如Rochester的直接跳到全文
· 增加Google图书搜索
· 连接到OCLC身份(OCLC Identities)
· 使用xISBN/thingISBN
· 用Bowker的ISSN服务强化元数据
· 无全文时集成本地文献传递服务到可选菜单[SFX无此功能?]

Umlaut目前还是一个完善中的平台,Jonathan Rochkind希望有感兴趣者加入作为开发伙伴。对于相关产品的期许是:有人为其它链接解析器提供API,这样也可用Umlaut;未来可以有商品化的链接解析器知识库可以购买。有关技术细节见:http://findit.library.jhu.edu/resolve

Umlaut原是Ross Singer在佐治亚州理工大学(GT)时开发的。Ross Singer觉得JHUmlaut需要改进的是解析速度过慢。但他很高兴JH用上Umlant,也希望由此有更多的SFX及其它链接解析器用户加入此行列。因为GT刚在近四周前撤下此应用,其原因除了他本人的离去外,主要是EBSCO的bug──其OpenURL加了<<SomeIdentifier(具体原因:Since this is injected into the location header via JavaScript (EBSCO sends their OpenURLs via a JavaScript popup), Internet Explorer and Safari don’t escape the URL which causes Mongrel to explode (these are illegal characters in HTTP, after all),而GT有差不多一半的电子资源来自EBSCO。
如果对技术细节感兴趣,Ross Singer此文绝对值得一看(12/17/07 – Resurgens – 1/11/08)。

参见:
Bibliographic Wilderness:(Re-)Introducing the Umlaut (1/14/08)
用(Re-)?对JH来说是引入Umlaut,但对于Umlaut来说,是再一次被引入。

Dilettante’s Ball:12/17/07 – Resurgens – 1/11/08