去年更新《新一代OPAC案例分析》(OPAC 2.0案例分析(2008版))时,澳大利亚国家图书馆(NLA)实验室(LibraryLabs)的四个与OPAC相关的原型只有“集成图书馆发现服务”(Single Business Protoype)仍在建设中。前些天,被称为SBDS原型0.1已经发布(Single Business Discovery Service)。由于是原型系统,所以有些数据可能是过时的,并没有及时更新,也就有可能碰到链接出错的情况。Beta版最早将于2009年10月发布。
略做试用,感觉除了OPAC 2.0的效果外,一站式集成的内容相当丰富,今后可以作为一个重要的参考数据源。看介绍(About),包括:
元数据:
* 澳大利亚国家书目数据库 1900万条
* 澳大利亚图片 160万张
* 澳大利亚研究在线 30万件
* OAIster 2000万资源
* Open Library 30万联机公共域图书
* Hathi Trust 20万联机公共域图书
* 维基百科 30万与图书相关的关键词(标签)
文本:
* 澳大利亚报纸:1803-1954年报纸文章全文
* Pandora 澳大利亚重要网站存档复制品
* NLA手稿检索工具
* 美国国会图书馆 40万图书目次、出版说明及部分章节
* Internet Archive 10万全文公共域图书
另外技术方面:
检索相关排序规则:
* 题名、主题或作者字段匹配优先
* 完全一致优先词干一致
* 检索词相邻优先分离
* 题名类似时,以附注及全文中出现检索词优先
* 密度优先(即检索词占全部查询文本的比例越高排序越先)
技术细节:
* Java编程语言
* Solr/Lucene索引
* MySQL记录聚类
* Jetty及Restlets为HTTP容器,FreeMarker为模板语言
本想照例做一些截屏,但发现在LibraryLabs的Wiki的项目介绍中,有据称为2008年十月澳大利亚图书馆咨询委员会会议准备的说明文件SINGLE BUSINESS DISCOVERY PROJECT(文件标明日期为2008/2/7),其附件中有六个屏幕设计样例,说明得很细致,基本上与现在情况吻合,自己也就省掉此步骤了。
还看到在2008年12月,项目组找了少量最终用户做了一个“卡片分类练习”(card sorting exercise),以确定最终的类别,及各类用语。大致浏览了一下长达31页的分析报告(Single Business Card Sort Report),很值得学习。
从概念上讲,这种方法属于“以用户为中心的设计”。网上查到一个中文说明“利用卡片分类进行信息架构”,有具体实施方法。所下的定义是:
卡片分类法(Card Sorting)是一种以用户为中心的方法,可以观察出用户如何理解和组织信息。顾名思义,就是将信息(概念、条目、内容、小分类等)分别写在一张张的卡片上,然后归类。既可以事先提供固定的分类,也可以由志愿者自己创建分类。通过卡片分类,可以了解用户所想,然后更好的完成页面、导航、内容组织等网站的信息架构。
对SBDS的介绍,参见(怎么都是OCLC的?):
Roy Tennant: One-Stop Searching With a Can-Do Attitude (May 26, 2009)
Lorcan Dempsey: A single business system environment redux (May 30, 2009)