日志标签 ‘乐此不疲’

澳大利亚国家图书馆的一站式发现服务

2009年5月31日

    去年更新《新一代OPAC案例分析》(OPAC 2.0案例分析(2008版))时,澳大利亚国家图书馆(NLA)实验室(LibraryLabs)的四个与OPAC相关的原型只有“集成图书馆发现服务”(Single Business Protoype)仍在建设中。前些天,被称为SBDS原型0.1已经发布(Single Business Discovery Service)。由于是原型系统,所以有些数据可能是过时的,并没有及时更新,也就有可能碰到链接出错的情况。Beta版最早将于2009年10月发布。

    略做试用,感觉除了OPAC 2.0的效果外,一站式集成的内容相当丰富,今后可以作为一个重要的参考数据源。看介绍(About),包括:

 元数据:

    * 澳大利亚国家书目数据库 1900万条
    * 澳大利亚图片 160万张
    * 澳大利亚研究在线 30万件
    * OAIster 2000万资源
    * Open Library 30万联机公共域图书
    * Hathi Trust 20万联机公共域图书
    * 维基百科 30万与图书相关的关键词(标签)

 文本:

    * 澳大利亚报纸:1803-1954年报纸文章全文
    * Pandora 澳大利亚重要网站存档复制品
    * NLA手稿检索工具
    * 美国国会图书馆 40万图书目次、出版说明及部分章节
    * Internet Archive 10万全文公共域图书

    另外技术方面:

检索相关排序规则:
    * 题名、主题或作者字段匹配优先
    * 完全一致优先词干一致
    * 检索词相邻优先分离
    * 题名类似时,以附注及全文中出现检索词优先
    * 密度优先(即检索词占全部查询文本的比例越高排序越先)

技术细节:
    * Java编程语言
    * Solr/Lucene索引
    * MySQL记录聚类
    * Jetty及Restlets为HTTP容器,FreeMarker为模板语言

    本想照例做一些截屏,但发现在LibraryLabs的Wiki的项目介绍中,有据称为2008年十月澳大利亚图书馆咨询委员会会议准备的说明文件SINGLE BUSINESS DISCOVERY PROJECT(文件标明日期为2008/2/7),其附件中有六个屏幕设计样例,说明得很细致,基本上与现在情况吻合,自己也就省掉此步骤了。

    还看到在2008年12月,项目组找了少量最终用户做了一个“卡片分类练习”(card sorting exercise),以确定最终的类别,及各类用语。大致浏览了一下长达31页的分析报告(Single Business Card Sort Report),很值得学习。
    从概念上讲,这种方法属于“以用户为中心的设计”。网上查到一个中文说明“利用卡片分类进行信息架构”,有具体实施方法。所下的定义是:
卡片分类法(Card Sorting)是一种以用户为中心的方法,可以观察出用户如何理解和组织信息。顾名思义,就是将信息(概念、条目、内容、小分类等)分别写在一张张的卡片上,然后归类。既可以事先提供固定的分类,也可以由志愿者自己创建分类。通过卡片分类,可以了解用户所想,然后更好的完成页面、导航、内容组织等网站的信息架构。

对SBDS的介绍,参见(怎么都是OCLC的?):
Roy Tennant: One-Stop Searching With a Can-Do Attitude (May 26, 2009)
Lorcan Dempsey: A single business system environment redux (May 30, 2009)

网络词典──中国地名的西文旧译

2009年1月24日

终于在年前把手头干了很久的活基本了结。
在这过程中遇到不少旧西文名称,不知对应的中文名称,于是频繁使用谷歌金山词霸,发现很多都是在“Google网络词典”部分得到答案的。其实它根本不是什么词典,只是把在不同网页中相邻出现的西文-汉语视为同义语呈现出来(尤其当一方在括号中出现时),可以说是一部虚拟词典。以它为参考,我得到了很多旧西文人名、地名、机构名的中文名称。比如Eroshenko中文名“爱罗先珂”,来自小说搜索网站的书目记录;比如Astor House Hotel为“浦江饭店”,来自该饭店自己的网站;比如Woosung即“吴淞”,其出处是某博客。
因为不是真正的词典,所以它远非完备,有些名称找不到。其中有的地名凭自己的知识还能猜出来,有的就一筹莫展了。幸好在寻找过程中在网上发现一位同行高人,蒙她热情相助,解了我不少疑问。

在此把自己得到的旧西文拼音地名部分列出来,或许哪天在Google网络词典上查到也未可知呢。由于这些地名通常按当地发音拼写,与现在通用的汉语拼音并不一致。

一、上海地名旧译

Shanghai, Shang-hai(英语)
Schanghai(德语)
Changhai, Chang-hai(法语)

Pootung 浦东
Tsang-Ka-Leu 张家楼(浦东)
Ngan-Hoei 南汇 [2010-9-10 网友好南儿留言指正实为安徽]
Tarzang 大场
Chenju 真如
Kiangwan 江湾
Yangtszepoo, Yangtszepoo Creek 杨树浦
Chapei 闸北
Hongkew, Hong Kew, Kong Que 虹口
Zi-ka-wei, Siccawei, Si-ka-wei  徐家汇
Tung-Ka-Doo 董家渡
Kiaochow Park 胶州公园
Honan Road 河南路
Shantung Road 山东路
To Malloo 大马路(南京路)
Whangpoo, Huang Pu River, Hwang Pu River 黄浦江
Woosung 吴淞
Woosung Bar吴淞口
Wusung River 吴淞江
Soochow Creek 苏州河
Lunghwa Temple 龙华寺
Tsungming 崇明
Tsungming Island 崇明岛

二、全国地名旧译

Tche-Li 直隶
Pékin 北京
Tientsin 天津
Honan 河南
Shantung 山东
Tringtau, Tsingtao 青岛
Kanton 广州

Yangtse, Yangtsze, Yangtsekiang, Yangtze-Kiang 长江
Chungking, Tchoung-King 重庆
Ichang, I-chang 宜昌
Hankow, Hankéou 汉口
An-whui / Ngan-Hoei安徽 [2010-9-10 据网友好南儿留言指正增加Ngan-Hoei]
Kiukiang 九江
Anking 安庆
Wuhu 芜湖
Panpu 蚌埠
Nanking 南京
Chinkiang 镇江
Soochow 苏州
Shihpu 许浦(苏州)
Haimen 海门
Kiangyin 江阴
Hai Chow 海州(连云港)
Kiangnan, Kiang-Nan 江南
Chekiang 浙江
Hangchow 杭州
Ningpo 宁波
Yin-hsien 鄞县(宁波)
Hoo-chow-foo 湖州府
Wenchow 温州

另:涉及上海的旧名还可以在上海市地方志办公室网站的“专业志”部分找到。最集中的如《上海租界志》附录,有“新旧路名对照”、“人名译名对照”及“机构、职衔等译名对照”。

Google结束目录搜索等服务

2009年1月16日

    当年刚迷上Google时,把它的每一个产品都玩了一遍,其中包括Google Catalog Search。此后Google实验室不断推出新产品,追着后面看都来不及。如果不是看到Google在1月15日结束始于2001年的目录搜索的消息,根本不会想起自己以前曾经见过Google的这个产品。
    职业关系,当初以为这个Catalog是图书馆目录,一番搜索,看到结果是一些彩色的产品目录。只觉得那些目录自己用不上,就没再关注了。
   昨天看到Google图书搜索(GBS)博客报道,才知道目录搜索与图书馆还真有点关系──目录搜索采用的“扫描+字符识别”的方式,在当年还属于新技术。从在小房间中自己扫描成千上万件目录开始,Google积累了经验,在2004年开始了大规模扫描图书馆藏书的Google Print项目,也即现在已达数百万册的Google图书搜索。
    据GBS博客报道,除了扫描与字符识别两方面,Google还由目录搜索学到了用户如何联机阅读扫描文献,以及如果更好地向用户展示这类信息。
    虽然产品本身不成功,但由此孕育出一个成功的产品,入黄泉也可瞑目了。所以GBS称目录搜索为“伟大的实验”。

Via Google Book Search Blog: Farewell, Google Catalog Search

    又:大概也是受金融风暴影响吧,Google停止多项服务。除了目录搜索,还有:
Google Video 视频(早入Google麾下的YouTube可取而代之)
Google Notebook 笔记本
Jaiku 微博客(Twitter更红火)
Mashup编辑器

    其中自己最觉得可惜的是Google笔记本,早半年刚开始习惯用它来记下一些临时的想法,很方便。好在只是停止开发,服务仍继续开放。

Via 译言:无可奈何花落去:Google 即将关闭Google 视频、记事本、目录搜索等服务

上海租界的俱乐部(总会)

2008年12月5日

    这两年,在做一个海外上海研究书目,花了不少精力。搜集到的西文文献中,涉及一些机构、团体、厂商、地名以及人名等,总希望知道当时通行的中文名称。

    网上没有发现较完整的对照表。相对而言,上海地方志办公室的电子版“专业志”里面较多些,尤其是《上海租界志》,附录有“机构、职衔等译名对照”。另外还有些有原名、有中文名的,散见于其他专业志,如《上海体育志》的“特记租界侨民体育”之“体育组织”()中有若干上海租界的俱乐部。

    以下是从不同来源找到的当年在上海的俱乐部及其中文名称,按原文字母顺序排列:

Amateur Dramatic Club (A.D.C.) 大英剧院
Country Club Shanghai 斜桥总会、英国乡村总会
Ejas Club 伊迦斯俱乐部(音乐)
Foreign Y.M.C.A 西侨青年会
German Club 上海德国总会
Harvard Club of Shanghai 上海哈佛总会
International Club of Shanghai 上海万国总会
International Recreation Club 万国体育会(亦称“上海运动事业基金董事会”)
Masonic Club, Shanghai 上海共济总会
Mercantile Marine Officers’ Association and Club 大副总会
The Recreation Club of Shanghai (S.R.C.) 上海跑马总会
Shanghai Book Club 上海书会(1851年改名“上海图书馆”Shanghai Library,俗称“洋文书院”)
Shanghai Club 上海总会,也译作上海俱乐部,又称英国总会、皇家总会
Shanghai Cricket Club 上海拍球总会(板球)
Shanghai Football Association 上海足球联合会 上海足球联合会(西联会)
Shanghai Jewish Club  上海犹太总会
Shanghai Paper Hunt Club 上海猎纸会
Shanghai Race Club 上海跑马总会    
Shanghai Recreation Fund 上海运动事业基金董事会(亦称“万国体育会”)
Shanghai Rowing Club 上海划船总会
Shanghai Rugby Union Football Club
Shanghai Wheelers 上海自行车俱乐部
Shanghai Yacht Club 上海飘艇总会(游艇)

贺本校学生在科文杯情报搜索大赛中获奖

2008年12月1日

[2008-12-2致歉:原文误将一上海交通大学获奖者归入本校名下,下文已重写更正]

    由上海图书馆上海科学技术情报研究所为庆祝上海情报事业50周年而举办的“科文杯”情报搜索大赛结果日前揭晓,本校共有10名学生获奖。虽然没有得到高等级的奖项,但如以团体计,本校获奖人数高居各参赛单位之首。比较遗憾的是,虽然在本馆网站上发布了消息,但本馆没有馆员获奖(估计也没有参赛的)。分析获奖名单,一、二等奖获得者中没有学生,三等奖中也只有1/3是学生,本校占了一半,可见本校学生实力不俗。

    颁奖仪式将于近日举行,本校获奖名单如下:
三等奖:桑培铭(信息学系07研)、史亚光(信息学系08研)、李雯静(信息学系07研)、王亚平(传播学系08本)、娄秀明(信息学系07研)
纪念奖:金楠(信息学系06本)、杨开泛(外语学院08研)、丁鹏宇(信息学系07研)、殷佳芸(信息学系06本)、杜嵩(信息学系08研)


    秀一下三等奖的靓丽奖品套装,大约外地的不能参加颁奖会,先行收到了奖品吧[盗链自小镇村夫·又红又专]

    获奖者以信息学系为主力军。除了恭喜诸位获奖者外,特别要祝贺以下几位:传播学系2008级本科生王亚平、信息学系2006级本科生金楠、殷佳芸,以及外语学院2006级硕士生杨开泛。
    以上名单如有遗漏或错误,请知情者告知。先谢过。

参赛者博文一窥:
痛苦的参赛过程──我在忙啥 (07研)
寄出答卷后的解脱──体验情报搜索大赛 (08研)
获奖感言──上图搜索大赛赛后感(07研)

参见:
网上的科文杯情报搜索大赛试题 (2008-10-27)