TextCat语言猜测家

以前介绍过施乐的“语言猜测家”,可以根据一段文字判定所属语言。前段日子发现那个链接失效了,只好重新找。今天找到“文本分类语言猜测家演示版”(TextCat Language Guesser Demo),很不错的网站,支持多达76种语言,速度也很快。
看介绍,TextCat是荷兰University of Groningen大学Gertjan van Noord在1994-1997年间,根据W.B. Cavnar和J.M. Trenkle在1994年的“文献分析和情报检索第三届年会”论文中提出的文本分类算法实施的。用Perl脚本实现,提供完整的源文件,供非商业免费使用。

网站还列出了其他一些语言识别工具(LANGUAGE IDENTIFICATION TOOLS),不过大概由于兴趣转移,如作者所说网站这部分已不再维护,所以大多链接都已失效,只能用来了解十多年前的语言识别工具状况,或者作为搜索这些工具新链接的起点。

scheme和schema的中文翻译

   看曾蕾和秦健二教授合著Metadata一书时,对scheme(s)和schema(s)的确切含意与中文翻译很是困惑。

第1章导言部分,第8页有这样一段:

The terms “metadata schemes,” “metadata standards,” “element sets,” and “metadata schemas” have subtle differences but are used interchangeably in the literature. These phrases are explained and differentiated in the text where necessary.
第11页首这一段:
The term-phrase metadata schema is often used interchangeably with the term-phrase metadata standard. In the literature, the word “schema” usually refers to an entire element set as well as the encoding of the elements and structure with a markup language.
第3章标题:Schemas–Structure and Semantics
第4章标题:Schemas–Syntax

刚看到Keven解释书社会中islanderlee提问“关于schema和schemata的中文翻译”中的一段,茅塞顿开:
在计算机数据描述领域,Scheme由于原意为“主题”,“方案”,“构想”等,因此一般指比较明确的(具体的)“方案”、“体系”,例如一个术语词表、分类表等,而Schema通常翻译成“模式”,比较强调形式化(formalized或normalized),多指一套编码规范(如XML Schema,RDF Schema)等,也可以指一套完整的数据规范。
注:2010-2-23首发于书社会

旧时上海的非政府组织(英汉名称对照)

    旧时上海的学会、协会、教会、委员会,每个组织背后都有故事,合起来就是一幅历史场景。
    《海外上海研究书目:1845-2005》的副产品。名称对照仅供参考,欢迎指正。

中国裴多裴学礼会 Phi Tau Phi Scholastic Honor Society of China
扶轮社 Rotary International
上海扶轮社 Rotary Club of Shanghai
亚洲文会 Royal Asiatic Society
上海文理学会 Shanghai Literary and Scientific Society
中国科学社 Science Society of China
上海园艺社 Shanghai Horticultural Society
中国工程师学会 Engineering Society of China
上海气象学会 Shanghai Meteorological Society
上海法文协会 Alliance française
上海中华协会 China Association (Shanghai)
中国左翼作家联盟 Chinese League of Left-Wing Writers
沪语社 Shanghai Vernacular Society

华洋义赈会 Chinese-Foreign Famine Relief Committee
上海国际救济会 International Relief Committee
上海战时难民救济会 Relief Society for Shanghai War Refugees
中国红十字会 Red Cross Society of China / Chinese Red Cross Society
上海万国红十字会 International Red Cross Society of Shanghai

上海各界妇女联合会 Joint Committee of Shanghai Women’s Organizations
各国妇女协会Foreign Women’s Home
力夫会 Mission to Rikishawmen
上海人力车夫互助会 Pullers’ Mutual Aid Association of Shanghai
济良所 The Door of Hope
上海进德会Moral Welfare League, Moral Welfare League of Shanghai
天足会 Natural Feet Society
不缠足会 Foot Emancipation Society
中国盲人院Institution for the Chinese Blind
中华国民拒毒会 National Anti-Opium Association of China

太平洋国际学会 Institute of Pacific Relations
六国调查沪案委员会 International Commission of Judges (1925)
上海国际鸦片委员会 International Opium Commmission, Shanghai
上海市民地方维持会/上海市地方协会 Shanghai Civil Association

犹太民族基金会中国委员会 Jewish National Fund Commission for China
上海犹太复国协会 Shanghai Zionist Association

华东基督教教育会 East China Christian Educational Association
华东基督教会大学顾问会 Advisory Council of the East China Christian Colleges and Universities
中华教育会 Educational Association Of China
全国基督教教育会 The China Christian Educational Association of China
中华职业教育社 Chinese National Association of Vocational Education

中华全国基督教协进会 National Christian Council of China
中国共济会 Grand Lodge of Free and Accepted Masons of China
上海共济总会 Masonic Club, Shanghai
中国天主教差会 Catholic China Mission
广学会 Christian Literature Society
基督教青年会 Y.M.C.A

上海火险协会 Shanghai Fire Insurance Association
上海保险协会 Shanghai Insurance Association
上海交易经纪人协会 Shanghai Exchange Brokers’ Association

万国体育会 Shanghai Recreation Fund
远东体育协会 Far Eastern Athletic Association
上海足球联合会(西联会)Shanghai Football Association