澳大利亚国家图书馆的一站式发现服务

    去年更新《新一代OPAC案例分析》(OPAC 2.0案例分析(2008版))时,澳大利亚国家图书馆(NLA)实验室(LibraryLabs)的四个与OPAC相关的原型只有“集成图书馆发现服务”(Single Business Protoype)仍在建设中。前些天,被称为SBDS原型0.1已经发布(Single Business Discovery Service)。由于是原型系统,所以有些数据可能是过时的,并没有及时更新,也就有可能碰到链接出错的情况。Beta版最早将于2009年10月发布。

    略做试用,感觉除了OPAC 2.0的效果外,一站式集成的内容相当丰富,今后可以作为一个重要的参考数据源。看介绍(About),包括:

 元数据:

    * 澳大利亚国家书目数据库 1900万条
    * 澳大利亚图片 160万张
    * 澳大利亚研究在线 30万件
    * OAIster 2000万资源
    * Open Library 30万联机公共域图书
    * Hathi Trust 20万联机公共域图书
    * 维基百科 30万与图书相关的关键词(标签)

 文本:

    * 澳大利亚报纸:1803-1954年报纸文章全文
    * Pandora 澳大利亚重要网站存档复制品
    * NLA手稿检索工具
    * 美国国会图书馆 40万图书目次、出版说明及部分章节
    * Internet Archive 10万全文公共域图书

    另外技术方面:

检索相关排序规则:
    * 题名、主题或作者字段匹配优先
    * 完全一致优先词干一致
    * 检索词相邻优先分离
    * 题名类似时,以附注及全文中出现检索词优先
    * 密度优先(即检索词占全部查询文本的比例越高排序越先)

技术细节:
    * Java编程语言
    * Solr/Lucene索引
    * MySQL记录聚类
    * Jetty及Restlets为HTTP容器,FreeMarker为模板语言

    本想照例做一些截屏,但发现在LibraryLabs的Wiki的项目介绍中,有据称为2008年十月澳大利亚图书馆咨询委员会会议准备的说明文件SINGLE BUSINESS DISCOVERY PROJECT(文件标明日期为2008/2/7),其附件中有六个屏幕设计样例,说明得很细致,基本上与现在情况吻合,自己也就省掉此步骤了。

    还看到在2008年12月,项目组找了少量最终用户做了一个“卡片分类练习”(card sorting exercise),以确定最终的类别,及各类用语。大致浏览了一下长达31页的分析报告(Single Business Card Sort Report),很值得学习。
    从概念上讲,这种方法属于“以用户为中心的设计”。网上查到一个中文说明“利用卡片分类进行信息架构”,有具体实施方法。所下的定义是:
卡片分类法(Card Sorting)是一种以用户为中心的方法,可以观察出用户如何理解和组织信息。顾名思义,就是将信息(概念、条目、内容、小分类等)分别写在一张张的卡片上,然后归类。既可以事先提供固定的分类,也可以由志愿者自己创建分类。通过卡片分类,可以了解用户所想,然后更好的完成页面、导航、内容组织等网站的信息架构。

对SBDS的介绍,参见(怎么都是OCLC的?):
Roy Tennant: One-Stop Searching With a Can-Do Attitude (May 26, 2009)
Lorcan Dempsey: A single business system environment redux (May 30, 2009)

广告:让我们建造一座完美图书馆(首都图书馆)

    接到豆瓣网友Nalsi邮件,邀请参加首都图书馆的“让我们建造一座完美图书馆”活动:


活动介绍
  ·  ·  ·  ·  ·  ·

【本次活动明信片、海报由北京电影学院摄影学院聂晓琴、刘洁志愿设计,向她们表示感谢!】

阳光,木桌,书海,墨香……这是属于图书馆的惬意时光。

阿根廷作家博尔赫斯说:“我总想象,天堂将如同图书馆一样。”

那么,你心中完美的图书馆,又该是怎样的地方?

我们邀请你,以文字、插画、摄影、拼贴……任何你喜爱的平面形式,与我们共同分享,你心目中完美图书馆的一切。

【如何参加】
方式1、如果你在北京,你可以到首都图书馆或者北京市的各家区县图书馆免费领取我们为此次活动特别订制的明信片,在背面进行创作或另附纸创作,在2009年8月31日前投回图书馆内的集纳箱里;

方式2、如果你不在北京或者你很宅(-__-),你还可以在活动相册里上传、在活动论坛里贴出你的大作。

首都图书馆二期正在建设中,正如在“2009图书馆服务宣传周”我们提出的主题“心服务 新感受”,我们希望我们全心的服务,能给你全心的感受,所以,我们迫切想听到你的声音。

    这类活动我不擅长,只能形式上参加,做一个旁观者。不过,对于热心2.0的图书馆,还是很喜欢的:

官网:http://www.clcn.net.cn/

mini site(豆瓣):http://www.douban.com/host/clcn/

互动沟通(豆瓣小组):http://www.douban.com/group/clcn/ (创建于2006-4-23)
活动侧记(博客):http://blog.sina.com.cn/clcn/
(首贴2007-12-06)
即时提醒(饭否):http://www.fanfou.com/clcn/(342个关注者,30条消息)
活动日历:http://www.google.com/calendar/embed?src=shoutujiangtan%40gmail.com(始于2008-6)

[update 2009-5-27] Nalsi=islanderlee
参见:最近在做的事 (2009-05-27)

开放获取的金科玉律

    虽然现在几乎每天都看很多英文,还会作些译介,但因为自感功力不够,极少全文翻译。其实早年像FRBR以及A Framework of Guidance for Building Good Digital Collections这样的经典,也是做过全译的,但都是只给自己看的,绝不示人。
去年11月中,台湾辅仁大学毛庆祯教授在Gtalk上问我对Open Access to Academic Literature是否有兴趣,原来他正向出版社获取中文翻译权,打算将一本Open
Access文集译成繁体中文,然后找个伙伴译成简体中文。当时自以为繁体改简体,不过是几个术语的差异,就一口应承下来。等按篇看到繁体翻译、转换成简体后,才发现实际上低估了这事,不核对原文,是没法完成简体中文的。
当时毛教授以为二周时间就可完成签约,实际上由于数十篇文章需要逐一取得原作者的授权,足足花了半年多时间,至今已大致落实。而简体中文的翻译,也就在这半年中陆陆续续地完成了。露怯的地方肯定不少,只能说尽力而为。
按毛教授的想法,是想同时出版繁体与简体译本,并在网上开放获取电子版,出版社正在联系中。台湾情况我不清楚,在大陆这似乎是不可能的──有哪家出版社会接受这种方式?

翻译过程中,感受到繁体中文、简体中文不仅在词汇方面有差异,在语法习惯上也不尽相同。由于是翻译,即使简体中文,也有不同的译法需要斟酌。以下举几个文中最常见的例子:
Open Access,繁体中文用的是“开放近用”。自己以往受lowie影响(“开放存取:学术出版的理性回归”),一直用“开放存取”,在开始翻译时,也这样用。但译了多篇以后,觉得虽然有“存”和“取”(用)两方面的开放,但Open Access的主要目的在于能够让公众开放地“取”(用),所以最后确定用“开放获取”。
    Initiative,这是近年用得很多的词,谷歌金山词霸《简明英汉词典》中有三个解释,一般选择“主动的行动,倡议”一项。译文中,如果是呼吁,则译为“倡仪”,如Budapest Open Access Initiatives(布达佩斯开放获取倡议);如果是付诸实施的项目,则译为“计划”,如Open Archives Initiative(开放档案计划);如果是情况介绍,就译为“行动”。
Creative Commons的译名最让人无奈。繁体中文译为“创用CC”,专有名词的特征比较明显。大陆原本用的是“创作共用”,还是具有识别意义的。至今“创作共用”的名称虽仍受资深网络人士推崇,无奈最终中文官方网站采用的是“知识共享”,如此一来,如果不加上引号,就根本无法知道这是一种特别的开放获取许可协议,但也只好用这个。

繁体中文意译较多,这基于对原文的心领神会。大部分情况下我会改成直译,主要是对自己领悟原文的能力没有信心。不过,当看到开放获取的两种方式被译为“金科”(Golden Road)、“玉律”(Green Road)时,钦佩不已,决定完全保留。曾向毛教授请教过此种译法的出处,没有得到答案。

参见维基百科:开放获取
开放获取一般有2种实现途径:
* 金色道路(Gold Road):开放获取期刊(OA Journals)
* 绿色道路(Green Road):作者自存档(Author self archiving)