TextCat语言猜测家

以前介绍过施乐的“语言猜测家”,可以根据一段文字判定所属语言。前段日子发现那个链接失效了,只好重新找。今天找到“文本分类语言猜测家演示版”(TextCat Language Guesser Demo),很不错的网站,支持多达76种语言,速度也很快。
看介绍,TextCat是荷兰University of Groningen大学Gertjan van Noord在1994-1997年间,根据W.B. Cavnar和J.M. Trenkle在1994年的“文献分析和情报检索第三届年会”论文中提出的文本分类算法实施的。用Perl脚本实现,提供完整的源文件,供非商业免费使用。

网站还列出了其他一些语言识别工具(LANGUAGE IDENTIFICATION TOOLS),不过大概由于兴趣转移,如作者所说网站这部分已不再维护,所以大多链接都已失效,只能用来了解十多年前的语言识别工具状况,或者作为搜索这些工具新链接的起点。

Chrome扩展程序:翻译及其他

在家一直用Firefox。Google Buzz刚开通时,不知道为什么用Firefox无法访问(现在可以了),就改用Chrome了。刚用上,没有安装任何插件/扩展,用起来很不顺手。

以前在Firefox上装了个翻译插件,单词即指即译,换上Chrome没有了翻译帮手,很不习惯。上网搜后,装了Bubble Translate。目前为1.2版,有几十种语言双向互译,并且不限单词,可以整句、整段翻译,就是一个简版Google翻译。除了需按Ctrl或Shift或Alt选中略有不适外,翻译结果在单击鼠标前不消失,且随屏幕滚动,也方便了在其他窗口记录结果。
Bubble Translate 下载地址:
https://chrome.google.com/extensions/detail/jlhlebbhengjlhmcjebbkambaekglhkf

同样的,以前手中翻墙工具都只适用于IE和FF,便找了个管理Chrome翻墙的,需自备梯子(这两天所用的梯子均失效,这个管理工具也用不上了,还需再努力备梯[update: 新梯已架好])。
Proxy Switchy! 下载地址:
https://chrome.google.com/extensions/detail/caehdcpeofiiigpdhbabniblemipncjj

刚去Google Chrome扩展程序库https://chrome.google.com/extensions浏览,发现一个可截取整个网页的扩展,十分好用。以前只能截屏,长度受限,现在再长的页面也能保存成一个PNG文件。
网页截图 – Webpage Screenshot 下载地址:
https://chrome.google.com/extensions/detail/ckibcdccnfeookdmbahgiakhnjcddpki

Koha中文展示网站及开机光盘下载

Koha是一个开源图书馆管理系统,在图书馆采用的开源ILS中占有很大比例。自2005年以来,台湾辅仁大学毛庆祯老师一直致力于推动Koha中文(繁体)的发展,Koha Taiwan较早的网站是Google Code上的“Koha中文化计划”,上面有Koha 2.2.9下载(2008年3月),现在主要的讨论与信息发布在Google网上论坛的“Koha台湾”。[update: Koha的最新资料参见:Koha 圖書館自動化系統]
“Koha台湾”为公共论坛,目前可通过https访问,或者用RSS阅读器订阅RSS Feed。加入论坛后,可及时收到邮件,并参与讨论。
最近论坛上发布了几个好消息:
1、中文展示網站(2010-2-26)
龙山架设的中文展示网站:http://ls.koha-tw.org/
这个展示网站不只供浏览,还可以导入书目、馆藏、读者记录(虚拟的),实际试验Koha的各种功能。发邮件申请帐号。
目前还没有什么数据,只能从“标签云”和“主题云”看几条试验数据。我申请的帐号也未能成功登录,尚未体验。可继续关注。[update: 已成功登录,体验中……部分截屏附下]
综合一下,目前有3种光盘,用此开启电脑(Ubuntu系统)即可进入Koha系统,有意探索着可下载后烧制光盘使用:
(1)mizstik 做的 Koha Live CD 第四版:
Release 4: Koha 3.0.5 Ubuntu 9.10 (x86)
使用 Zebra! 免设定。下载:
http://sourceforge.net/projects/kohalivecd/files/
(2)Ubuntu LiveCD with minimal Gnome-Desktop, pre-configured
1) DSpace,
2) PKP OAI Harvester,
3) Koha Library Management Software and
4) dbwiz (A federated search engine for online journals/databases, OPACs and DSpace repositories)
含DSpace、PKP OAI收割、Koha及dbwiz联邦搜索引擎。下载:
http://sourceforge.net/projects/liblivecd/
(3)台湾国家高速网路中心Thomas制作的中文介面光盘 LiveKoha。下载:
http://trac.koha-tw.org/wiki/LiveKoha
注:Koha功能可参见:Koha 2.2 简介(Paul POULAIN;繁体中文版,毛庆祯译)