存档在 2009 年五月

澳大利亚国家图书馆的一站式发现服务

2009年5月31日

    去年更新《新一代OPAC案例分析》(OPAC 2.0案例分析(2008版))时,澳大利亚国家图书馆(NLA)实验室(LibraryLabs)的四个与OPAC相关的原型只有“集成图书馆发现服务”(Single Business Protoype)仍在建设中。前些天,被称为SBDS原型0.1已经发布(Single Business Discovery Service)。由于是原型系统,所以有些数据可能是过时的,并没有及时更新,也就有可能碰到链接出错的情况。Beta版最早将于2009年10月发布。

    略做试用,感觉除了OPAC 2.0的效果外,一站式集成的内容相当丰富,今后可以作为一个重要的参考数据源。看介绍(About),包括:

 元数据:

    * 澳大利亚国家书目数据库 1900万条
    * 澳大利亚图片 160万张
    * 澳大利亚研究在线 30万件
    * OAIster 2000万资源
    * Open Library 30万联机公共域图书
    * Hathi Trust 20万联机公共域图书
    * 维基百科 30万与图书相关的关键词(标签)

 文本:

    * 澳大利亚报纸:1803-1954年报纸文章全文
    * Pandora 澳大利亚重要网站存档复制品
    * NLA手稿检索工具
    * 美国国会图书馆 40万图书目次、出版说明及部分章节
    * Internet Archive 10万全文公共域图书

    另外技术方面:

检索相关排序规则:
    * 题名、主题或作者字段匹配优先
    * 完全一致优先词干一致
    * 检索词相邻优先分离
    * 题名类似时,以附注及全文中出现检索词优先
    * 密度优先(即检索词占全部查询文本的比例越高排序越先)

技术细节:
    * Java编程语言
    * Solr/Lucene索引
    * MySQL记录聚类
    * Jetty及Restlets为HTTP容器,FreeMarker为模板语言

    本想照例做一些截屏,但发现在LibraryLabs的Wiki的项目介绍中,有据称为2008年十月澳大利亚图书馆咨询委员会会议准备的说明文件SINGLE BUSINESS DISCOVERY PROJECT(文件标明日期为2008/2/7),其附件中有六个屏幕设计样例,说明得很细致,基本上与现在情况吻合,自己也就省掉此步骤了。

    还看到在2008年12月,项目组找了少量最终用户做了一个“卡片分类练习”(card sorting exercise),以确定最终的类别,及各类用语。大致浏览了一下长达31页的分析报告(Single Business Card Sort Report),很值得学习。
    从概念上讲,这种方法属于“以用户为中心的设计”。网上查到一个中文说明“利用卡片分类进行信息架构”,有具体实施方法。所下的定义是:
卡片分类法(Card Sorting)是一种以用户为中心的方法,可以观察出用户如何理解和组织信息。顾名思义,就是将信息(概念、条目、内容、小分类等)分别写在一张张的卡片上,然后归类。既可以事先提供固定的分类,也可以由志愿者自己创建分类。通过卡片分类,可以了解用户所想,然后更好的完成页面、导航、内容组织等网站的信息架构。

对SBDS的介绍,参见(怎么都是OCLC的?):
Roy Tennant: One-Stop Searching With a Can-Do Attitude (May 26, 2009)
Lorcan Dempsey: A single business system environment redux (May 30, 2009)

广告:让我们建造一座完美图书馆(首都图书馆)

2009年5月26日

    接到豆瓣网友Nalsi邮件,邀请参加首都图书馆的“让我们建造一座完美图书馆”活动:


活动介绍
  ·  ·  ·  ·  ·  ·

【本次活动明信片、海报由北京电影学院摄影学院聂晓琴、刘洁志愿设计,向她们表示感谢!】

阳光,木桌,书海,墨香……这是属于图书馆的惬意时光。

阿根廷作家博尔赫斯说:“我总想象,天堂将如同图书馆一样。”

那么,你心中完美的图书馆,又该是怎样的地方?

我们邀请你,以文字、插画、摄影、拼贴……任何你喜爱的平面形式,与我们共同分享,你心目中完美图书馆的一切。

【如何参加】
方式1、如果你在北京,你可以到首都图书馆或者北京市的各家区县图书馆免费领取我们为此次活动特别订制的明信片,在背面进行创作或另附纸创作,在2009年8月31日前投回图书馆内的集纳箱里;

方式2、如果你不在北京或者你很宅(-__-),你还可以在活动相册里上传、在活动论坛里贴出你的大作。

首都图书馆二期正在建设中,正如在“2009图书馆服务宣传周”我们提出的主题“心服务 新感受”,我们希望我们全心的服务,能给你全心的感受,所以,我们迫切想听到你的声音。

    这类活动我不擅长,只能形式上参加,做一个旁观者。不过,对于热心2.0的图书馆,还是很喜欢的:

官网:http://www.clcn.net.cn/

mini site(豆瓣):http://www.douban.com/host/clcn/

互动沟通(豆瓣小组):http://www.douban.com/group/clcn/ (创建于2006-4-23)
活动侧记(博客):http://blog.sina.com.cn/clcn/
(首贴2007-12-06)
即时提醒(饭否):http://www.fanfou.com/clcn/(342个关注者,30条消息)
活动日历:http://www.google.com/calendar/embed?src=shoutujiangtan%40gmail.com(始于2008-6)

[update 2009-5-27] Nalsi=islanderlee
参见:最近在做的事 (2009-05-27)

开放获取的金科玉律

2009年5月23日

    虽然现在几乎每天都看很多英文,还会作些译介,但因为自感功力不够,极少全文翻译。其实早年像FRBR以及A Framework of Guidance for Building Good Digital Collections这样的经典,也是做过全译的,但都是只给自己看的,绝不示人。
    去年11月中,台湾辅仁大学毛庆祯教授在Gtalk上问我对Open Access to Academic Literature是否有兴趣,原来他正向出版社获取中文翻译权,打算将一本Open
Access文集译成繁体中文,然后找个伙伴译成简体中文。当时自以为繁体改简体,不过是几个术语的差异,就一口应承下来。等按篇看到繁体翻译、转换成简体后,才发现实际上低估了这事,不核对原文,是没法完成简体中文的。
    当时毛教授以为二周时间就可完成签约,实际上由于数十篇文章需要逐一取得原作者的授权,足足花了半年多时间,至今已大致落实。而简体中文的翻译,也就在这半年中陆陆续续地完成了。露怯的地方肯定不少,只能说尽力而为。
    按毛教授的想法,是想同时出版繁体与简体译本,并在网上开放获取电子版,出版社正在联系中。台湾情况我不清楚,在大陆这似乎是不可能的──有哪家出版社会接受这种方式?

    翻译过程中,感受到繁体中文、简体中文不仅在词汇方面有差异,在语法习惯上也不尽相同。由于是翻译,即使简体中文,也有不同的译法需要斟酌。以下举几个文中最常见的例子:
    Open Access,繁体中文用的是“开放近用”。自己以往受lowie影响(“开放存取:学术出版的理性回归”),一直用“开放存取”,在开始翻译时,也这样用。但译了多篇以后,觉得虽然有“存”和“取”(用)两方面的开放,但Open Access的主要目的在于能够让公众开放地“取”(用),所以最后确定用“开放获取”。
   
Initiative,这是近年用得很多的词,谷歌金山词霸《简明英汉词典》中有三个解释,一般选择“主动的行动,倡议”一项。译文中,如果是呼吁,则译
为“倡仪”,如Budapest Open Access
Initiatives(布达佩斯开放获取倡议);如果是付诸实施的项目,则译为“计划”,如Open Archives
Initiative(开放档案计划);如果是情况介绍,就译为“行动”。
    Creative
Commons
的译名最让人无奈。繁体中文译为“创用CC”,专有名词的特征比较明显。大陆原本用的是“创作共用”,还是具有识别意义的。至今“创作共用”的名称虽仍受资深网络人士推崇,无奈最终中文官方网站采用的是“知识共享”,如此一来,如果不加上引号,就根本无法知道这是一种特别的开放获取许可协议,但也只好用这个。

   
繁体中文意译较多,这基于对原文的心领神会。大部分情况下我会改成直译,主要是对自己领悟原文的能力没有信心。不过,当看到开放获取的两种方式被译为“金科”(Golden Road)、“玉律”(Green Road)时,钦佩不已,决定完全保留。曾向毛教授请教过此种译法的出处,没有得到答案。

参见维基百科:开放获取
开放获取一般有2种实现途径:
    * 金色道路(Gold Road):开放获取期刊(OA Journals)
    * 绿色道路(Green Road):作者自存档(Author self archiving)   

我的谷歌地图──神州-东瀛履痕

2009年5月22日

    曾经收藏过花果山的博文“豆瓣图书馆”和“图书馆学的教科书,被气死”。博主哈雷前两天发来邮件,说自己信管系本科毕业工作后,现在很向往图书馆工作,咨询如何才能实现,是否一定要考研。自己只能就身边的情况告知一二。
    回邮后浏览了他的博客,
有不少和图书馆有关的内容,还发现有厦门的售票点地图,便向他请教如何做成的。根据他推荐的指南,做了几个试验,“神州-东瀛履痕”是其中之一。


   玩Google经常花掉不少时间,比如体验Picasa网络相册的脸部识别功能
[update 2009-5-23: 今天发现Picasa一个很恶劣的问题:之前加过的name tag,只要是没有联系人邮箱的,全都不见了!],那几天每天弄到深更半夜。这次决定不能玩物丧志,接下来计划用“我的地图”做院系资料室位置图。

附哈雷推荐的使用帮助:

如何使用
google“我的地图”使用帮助
香港版“我的地图”使用帮助(这个讲得清楚一点)

地图应用实例
谷歌发现之旅,展现家乡之美

香港版google地图比赛

广告:Sun公司《云计算入门指南》

2009年5月21日

    通常广告邮件没有进入垃圾箱,也会不经阅读直接被删除。但看到主题为“免费下载Sun新发布的《云计算入门指南》(AD)”的邮件,还是仔细看了一下:

尊敬的客户:

谈论云计算时,人们很容易迷失方向。大家似乎都拥有云、连接云、实现云、或者至少准备好实施云。 其中有许多行话,但行话后面,也蕴藏着一些非常真实的商业和技术利益。

Sun 新发布的《云计算入门指南》将帮助您去粗取精,去伪存真 — 并为您提供一个框架,用来确定云计算是否对于您的机构有意义以及有何意义。我们将帮助您揭开云计算的神秘面纱,并向您说明如何在此环境中实现虚拟化和进行软件部署。

在这份 24 页的免费指南中,内容包含:

  1. 定义云计算及其优点
  2. 解释不同的云类型(公用云、专用云和混合云)
  3. 描述架构服务层(例如,把软件当作服务)
  4. 详细说明基本虚拟化技术
  5. 建议入门所需采取的后续步骤和行动

您还将了解到 Sun 公司的方法 — 它将利用开放源和开放标准,提供企业、开发人员和最终用户在构建云环境时所需具备的所有组件。

PDF 下载本指南

获得本指南,并投身于云中。

太阳计算机系统(中国)有限公司



    发来的邮箱非Sun公司域名,下载链接也不是,链过去后转到sun.com,经确认为Sun公司网站。下载前需要填写单位等信息,但不做审核。“指南”中广告内容不少,不过看后很有收获。