日志标签 ‘郢书燕说’

濒危语言:受威胁的思想

2009年3月4日

    前一阵《新民晚报》发文称说上海话没文化引起一片口水,除了地域情结及社会心结,方言的衰弱是其背后不争的事实。很多人似乎并不在乎方言的消失,以所谓的“繁荣”为最高目标,其实两者不一定是你死我活的。繁荣总有度,而消失的文化却不是想要就能找回来的。[update: “先污染、后治理”已经被大家认同为落后的经济发展模式,但“先挤压、后抢救”却仍是司空见惯的文化现象。]
    2月21日是国际母语日,联合国教科文组织《信使》杂志2009年第2期发布,专题名称“濒危语言:受威胁的思想”──提到这个高度,正说明语言对于多样化社会的重要。当然有人希望大家“同一个梦想”,对此只能是无话可说。
   
刊中引用联合国教科文组织总干事松浦晃一郎的话:“一种语言的消失导致许多非物质文化遗产形式的消失,特别是操这种语言的团体——不必说诗和传说,更不必说谚语和笑话——传统和口头表达组成的珍贵传承。语言的消失同样损害人与生物多样性之间保持的关系,因为语言荷载着丰富的自然以及宇宙知识。”

    本期有一篇文章“每一种语言都是结构独特的思想世界”,介绍《联合国教科文组织新版世界濒危语言图谱》。去年,阿拉斯加(美国)的eyak语随着Marie Smith Jones辞世而灭绝;1992年土耳其的oubykh语随着Tevfik
Esenç逝世灭绝;1974年随着Ned
Maddrell逝世,马恩岛人所操的马恩语灭绝……。根据《联合国教科文组织新版世界濒危语言图谱》,200多种语言在三代内灭绝了。(图谱始于1950年)
    在这个图谱中,中国有143种语言被列入不安全以上级,基本上在少数民族区域:

    由于中国人口庞大,汉语的众多方言现在还不是濒危语言。不过,谁知道N代以后会不会也列入这个图谱呢?要知道,法语曾随殖民地扩展成为世界强势语言之一,然而法国北方方言chtimi语却是联合国教科文组织评定的濒危语言。(严肃地讲, chti语是什么?
    本期另有一篇“Wuthing we gwen tull?(我们说什么呢?)”,用事例说明“学校可以灭绝或振兴一种语言”。但愿我们的学校不再强求学生在校讲普通话,给方言保留一点生存的土壤。

链接:
联合国教科文组织推出新版世界濒危语言图谱 (2009-2-19)
《联合国教科文组织新版世界濒危语言图谱》(有英、法、西班牙文版)
UNESCO Interactive Atlas of the World’s Languages in Danger

订阅《信使》:http://typo38.unesco.org/zh/cour-subscribe.html

参见:
One World, One Dream
(2008-08-10)
语委的上海话调查──用统计欺骗人 (2007-09-29)

读《元数据》(预告篇)

2009年2月28日

    曾说了很多次编目员宜转型做元数据图书馆员,其实自己对元数据所知甚少。做花生壳“关于内容编码体系及规范控制的问卷小调查”,弄得自己信心全无,于是说她的问卷题目不厚道,其实是宣称自己很无知。

 

    最近开始读曾蕾与秦健教授的Metadata,感觉这本教科书对我这样只有零碎的元数据知识的读者,很是适用。比如以往对Keven常挂口中的“应用纲要”没有任何感觉,现在总算理解了。再比如,刚开始接触数字图书馆时,发现到处都是“最佳实践”或者“良好实践”,现在也多少知道其语境了。自然,花生壳眼里的基础题现在也难不倒我了。
    因此,大言不惭地说,作者真是送对人啦 :-) 虽然书到手两个月才开始读,到现在为止还只看完第三章(阅读速度每晚10页左右),并且其余的一多半看来还要过些日子才会继续读,感觉很是对不起两位 :-(
    全书看完,将写读后感若干,先做广告在此。

参见:《元数据》与metadataetc.org (2008-07-12)

《新数字秩序的革命》语录(笔记之三)

2009年2月12日

 

 

《新数字秩序的革命》戴维·温格格著,张岩译. 北京:中信出版社,2008. ISBN 978-7-5086-1292-8

 

 

    亚马逊网站自身同一家遵从杜威体系的图书馆之间的距离也是人类所能达到的最远距离了。(P60)

    杜威的目的是绘制知识地图……杜威体系……真正的问题是任何一种知识地图都假设知识存在地理特性,具有组织严密的结构并且是有形的。这个观念在第一及第二层秩序中还是说得过去的。但是,它却无谓地妨害了第三层次中杂乱无章秩序的作用。(P61)

    阮冈纳赞充满神秘色彩的体系却有一个使其在基于计算机的系统中空前强大的特性:没有哪个方面必须被当做“根本”。计算机不需要事先确定“适当的”树形结构应该是什么样子的,而是可以根据与用户的互动来即时建构树形图。(P82)

    秩序掩盖的信息通常比它所揭示的要多,这是一个基本事实,而这个事实本身也被这个世界的组织艺术和科学掩盖了。我们就像盲人摸象寓言中摸象的盲人……(P91)

    到底哪个群体得到了资金支持可以决定这个社会到底相信什么,而资金却常常是由那些不像专家们那么博学的人提供的:DNA研究中心的命运可能会由国会议员们来决定,而这些人甚至无法区分核糖体(ribosome)和长号(trombone)。(P104)

    当庞杂多元的体系动摇了我们对知识本质的认定,处于危机中的不仅仅是目录卡片的未来。(P104)

    长久以来,我们都依赖专家来过滤和组织信息,避免为那些不值得花时间的事情浪费光阴,并为自己的信仰找到一个坚实的基础。(P136)

    一切自称保持中立的机构,不过是打着中立幌子来保留其势力和特权。(P140)

    知识存在于联系和鸿沟当中,需要你的积极参与。(P150)

    社会交往图表的混乱程度常常可以用来衡量一家公司的创新能力。(P189)

    要是我们一开始都必须定义主题的话,就没有哪个单独的课程可以在这所大学或者其他任何一所大学里开设──埃诺莉·罗施(加州大学伯克利分校心理学系教授)(P191)

    在多元杂乱的世界中,知识同非知识的距离最多也只有一个链接之遥。……知识还能够保持其特权地位吗?(P211)

    有人将互联网当做一个人人都可以平等地发表自己看法的地方,而这种看法只是一个乌托邦式的美好理想,是由那些愚蠢的思想家和正在渐渐老迈的嬉皮士做出的空洞的承诺。(P212)

    网络对话看起来很像是回音室……旁观者会认为那是一群想法一致的人在相互肯定对方的看法。但是,这样的观点其实是错把谈话的基础看做谈话本身了。通过站在同样的基础上沟通彼此的不同意见,我们才最终实现了理解。(P213)

    在拉丁语中有这样一个谬误──诉诸权威谬误,这提示我们,我们不能够因为一个人在某个领域是专家就认为他的看法在其他领域也是可靠的。……某个专业领域的范围大概跟图书馆里一个书架的图书涵盖的范围差不多大。(P215)

    在《大英百科全书》中,篇幅是一种标记重要性的符号,而在维基百科,篇幅体现的是兴趣和热情的强烈程度,即使这种兴趣和热情只属于一个人。(P218)

关于语义网
(语义网络、RDF、本体)此类项目再次创造出了传统的知识分类方法所面临的问题:人类的话题实在是太庞杂太模糊了,根本就不可能被装进哪一套框框里!(P201)
语义网络还需要我们用将来时态来讨论,是一种“要是可以实现一定会很酷”的东西──菲尔·温德利(社交网络公司Utah前首席信息官)(P203)
建立一个世界范围的语义网络是个过于野心勃勃的抱负,它同样无法解决困扰了杜威分类体系和其他大型分类法的问题。(P203)

让计算机替代我们吧──读《新数字秩序的革命》(笔记之一)

2009年2月10日

    世界原本是杂乱无章的,自人类历史开始以来,历代各界的管理者、实践者、研究者就致力于在其领域范围内做有序化。然而,戴维·温伯格说“诸事混杂”(Everything is Miscellaneous: the power of the new digital disorder,中译本《新数字秩序的革命》),原来经系统化的有序内容到现在又变得一地鸡毛,似乎现实世界并没有一成不变的秩序。本国专家说网瘾是一种精神疾病,而外国专家对同性恋是否算某种精神病也有过争议(P30),这类见解似乎还比较社会化且主观;但对行星到底是9个还是900个的争议(P32-35)导致冥王星最终被逐出行星行列,看上去自然的、客观的世界也因主观化而越发没有秩序了。

    温伯格腹中装满各种故事,对我而言并不好懂。书中将世界秩序分成三个层次,却只是举例说明,并没有给出三个层次的定义。就好象提姆·奥莱理(Tim O’Reilly)文章“什么是Web2.0”,却只说七个特征并举一堆例子,并没有给出定义。本书明言“避开定义”(P190),另有一个小标题是“似乎、大致的世界”(P203),或许没有定义、靠心领神会就是这个时代的特征?
    以我对那些故事的理解,三层秩序分别是:第一层秩序是经过组织的实体,那是人类最古老的整理方式。第二层秩序是以实体方式对这些实体加以描述;通过手工标引并组织元数据(可以计算机来组织),使第一层秩序的实体得以从不同角度获取进而利用,则属第二层秩序的较高层次,可以是实体的、也可以是虚拟的。图书馆所用的分类编目就是其中的佼佼者。
    书中大量篇幅讲的是第三层秩序,也就是在打破秩序的数字世界里,任一对象都是智能叶片──可以同时挂在不同的枝干上。由此,使用者不管从哪里出发,都可以生成需要的结果,而不是必须遵从某种既定的、非此即彼的唯一体系,不管是林奈的生物分类体系(P72-78)、杜威的十进制分类法(P45-56)还是其他。miscellaneous有“多种多样的”的意思,世界万物原本有多种属性,源自亚里斯多德的树形结构(P69-72)应该不限定只入一个分支,现在是复归其多样性的时候了。

    看完全书,想想组织数字世界的方式或可分成两类。一类是针对人的,搜集人在各处留下的痕迹并加以整理,所谓“在云层中寻找”(P167-170),让那些内隐的信息显性化(第八章“虚无的诉说”)。另一类是针对数字对象的,由参与者主动添加内容,比如社会网络的智能叶子──标签,把标引对象挂到不同的树枝上(或者把任何东西都当作元数据),然后由计算机来分析处理这堆标签,在使用者搜索的时候,不但提取这些标签,还根据标签分析结果提供各种建议。比如(P97)在Flickr上搜索带有“Capri”标签的照片,它会自动将搜索到的照片按意大利卡普里岛和福特卡普雷车区分开来。如果从情报学角度,使用受控词表可以实现这样的功能,但在Flickr中是通过分析人们为这些照片添加的标签为实现的。

    西北图客介绍此书时说是“一本图书馆员最好不要阅读的书《新数字秩序革命》”(2009-01-03),因为书中有不少篇幅述及图书馆相关内容,如美国国会图书馆维护书目(P10-11),杜威十进分类法(P45-56)、ISBN甚至FRBR (P121-130),令人产生一度有效的图书馆组织实体资源的传统已经过时之感。不过,书中对阮冈纳赞及其冒号分类法还是相当的推崇(P80-82)──“该体系居然是在70年前,也就是计算机时代到来之前几十年,由一位图书管理员受到某种机械玩具的启发而发明的,这一点让人感到非常惊讶”。Endeca是书中所举第三层秩序时代使用此方法的成功实例(北卡州的新一代OPAC即由此公司提供)。
    在数字时代,不只是图书馆界遭遇问题,很多学界也同样如此。就好象图书馆员无论地位还是形象,在全球都差不多,但我们就认定本国馆员最为不堪,这是没有任何道理的。任何职业都有宿命,有时并不源于自身。
    不过,即使图书馆中的资料全都数字化了,至少目前这种“智能叶子”方法还不能解决所有问题,尤其是学术搜索的问题(可惜找不到书中的说法了),以LC参考馆员托马斯·曼为代表的反对派并不是无理取闹(可参见:“记录在案”走入歧途──对书目控制未来工作组报告的回应(2008-03-23))。或许在组织数字世界中我们还有努力的机会?
    比如温伯格提出的组织知识的四条新策略(P105-108):
在出口建立筛选装置,而不是入口
将每一片叶子都放到尽可能多的树枝上
每样东西都是元数据而且什么都可以被当做标签
放弃控制
    这四条策略,在传统的情报检索语言中貌似都能找到原型,分别是:后控、后组、自由词、非控

    未来的技术是什么,RDF、本体、微格式到世界范围的语义网吗(P197-203)?
    第十章末说:“世界不会一直保持杂乱无章的状态,因为我们在齐心协力把它变成属于我们的”。(P237) 我以为,群众的智慧、人海战术可以为数字世界添砖加瓦(标引),但最终的组织应该属于计算机。亚马逊的各种推荐(书中称为“联合筛选”)就是一个常被人提起的例子(P56-61亚马逊的嘉年华),新一代图书馆OPAC的借阅推荐、查询推荐也源于亚马逊的做法。
    我是相信计算机处理能力的。我不认为MARC会安乐死,不是相信编目员可以天长地久,只是不相信死到临头再折腾出来的新框架会比MARC更有前途。雨僧不是在问么:“我们需要RDA吗?”(2009-01-30)虽然RDA只是AACR2(编目规则)的替代品,与MARC(机读目录格式)绝非誓不两立。   

 

 

《新数字秩序的革命》戴维·温格格著,张岩译. 北京:中信出版社,2008. ISBN 978-7-5086-1292-8

捉刀记

2008年12月9日

    捉刀是一种非常普遍的现象。比如单位评先进,需要上报材料的,通常会叫被评部门或个人自己写,美其名曰你(们)自己最了解,其实内心是觉得,当先进已经够便宜你(们)了,还想让别人辛苦劳累?类似的,学生要老师写推荐,老师通常会让学生自己写,然后签上自己的大名──谁得益、谁劳动么。
    有的捉刀就不是这样了。比如领导们的秘书,那是工作,劳动者不是得益者。某百科全书式的著名学者,也是领导,其高产量不知现在是否还是全国第一,据说秘书无数,一个学科有一个学科的秘书。这样的高龄学者,多少著述出自己手,就不得而知了。
    还见到不少公开场合述及元老级学者,都说已XX高龄仍如何如何,令人在佩服之余,有时不由得怀疑其真实性。前几年,在QQ群里某网友称赞巴金已百岁,仍继续工作,任上海中国作家协会主席。其时,已经有好几年了,上海观众看到市领导逢年过节前往医院探望,电视画面只见领导、不见巴老。倒是不知道有没有替巴老捉刀的。
    今天看到11月30日的《上海盟讯》(http://www.minmengsh.gov.cn/shmx.asp)上一篇文章,应该是纪念上月以百岁高龄过世的谈家桢院士,不过是从另一个角度──“给谈先生写稿”,总结了作者替谈先生捉刀的漫长历史,从1989年冬(80岁)到2007年(98岁)。除了发言稿,还包括1993年谈家桢纪念毛润之的文章,“和以往一样,谈先生没提什么意见”。
    文章结尾处,作者感慨“给谈先生写稿,总的感觉就是两个字──舒服”。似乎不愉快的捉刀经历也不鲜见呢。
    该期报纸目前还没挂上网,过一阵应该可以下载全文

[update] 附记,不知道老毛的大名在博文中也是呼不得的。后台显示正常,大家看到的就是三颗星了。于是呢,嘿嘿,用“字”试试,OK啦!