澳大利亚国家图书馆的一站式发现服务

    去年更新《新一代OPAC案例分析》(OPAC 2.0案例分析(2008版))时,澳大利亚国家图书馆(NLA)实验室(LibraryLabs)的四个与OPAC相关的原型只有“集成图书馆发现服务”(Single Business Protoype)仍在建设中。前些天,被称为SBDS原型0.1已经发布(Single Business Discovery Service)。由于是原型系统,所以有些数据可能是过时的,并没有及时更新,也就有可能碰到链接出错的情况。Beta版最早将于2009年10月发布。

    略做试用,感觉除了OPAC 2.0的效果外,一站式集成的内容相当丰富,今后可以作为一个重要的参考数据源。看介绍(About),包括:

 元数据:

    * 澳大利亚国家书目数据库 1900万条
    * 澳大利亚图片 160万张
    * 澳大利亚研究在线 30万件
    * OAIster 2000万资源
    * Open Library 30万联机公共域图书
    * Hathi Trust 20万联机公共域图书
    * 维基百科 30万与图书相关的关键词(标签)

 文本:

    * 澳大利亚报纸:1803-1954年报纸文章全文
    * Pandora 澳大利亚重要网站存档复制品
    * NLA手稿检索工具
    * 美国国会图书馆 40万图书目次、出版说明及部分章节
    * Internet Archive 10万全文公共域图书

    另外技术方面:

检索相关排序规则:
    * 题名、主题或作者字段匹配优先
    * 完全一致优先词干一致
    * 检索词相邻优先分离
    * 题名类似时,以附注及全文中出现检索词优先
    * 密度优先(即检索词占全部查询文本的比例越高排序越先)

技术细节:
    * Java编程语言
    * Solr/Lucene索引
    * MySQL记录聚类
    * Jetty及Restlets为HTTP容器,FreeMarker为模板语言

    本想照例做一些截屏,但发现在LibraryLabs的Wiki的项目介绍中,有据称为2008年十月澳大利亚图书馆咨询委员会会议准备的说明文件SINGLE BUSINESS DISCOVERY PROJECT(文件标明日期为2008/2/7),其附件中有六个屏幕设计样例,说明得很细致,基本上与现在情况吻合,自己也就省掉此步骤了。

    还看到在2008年12月,项目组找了少量最终用户做了一个“卡片分类练习”(card sorting exercise),以确定最终的类别,及各类用语。大致浏览了一下长达31页的分析报告(Single Business Card Sort Report),很值得学习。
    从概念上讲,这种方法属于“以用户为中心的设计”。网上查到一个中文说明“利用卡片分类进行信息架构”,有具体实施方法。所下的定义是:
卡片分类法(Card Sorting)是一种以用户为中心的方法,可以观察出用户如何理解和组织信息。顾名思义,就是将信息(概念、条目、内容、小分类等)分别写在一张张的卡片上,然后归类。既可以事先提供固定的分类,也可以由志愿者自己创建分类。通过卡片分类,可以了解用户所想,然后更好的完成页面、导航、内容组织等网站的信息架构。

对SBDS的介绍,参见(怎么都是OCLC的?):
Roy Tennant: One-Stop Searching With a Can-Do Attitude (May 26, 2009)
Lorcan Dempsey: A single business system environment redux (May 30, 2009)