让计算机替代我们吧──读《新数字秩序的革命》(笔记之一)

世界原本是杂乱无章的,自人类历史开始以来,历代各界的管理者、实践者、研究者就致力于在其领域范围内做有序化。然而,戴维·温伯格(David Weinberger)说“诸事混杂”(Everything is Miscellaneous: the power of the new digital disorder,中译本《新数字秩序的革命》),原来经系统化的有序内容到现在又变得一地鸡毛,似乎现实世界并没有一成不变的秩序。本国专家说网瘾是一种精神疾病,而外国专家对同性恋是否算某种精神病也有过争议(P30),这类见解似乎还比较社会化且主观;但对行星到底是9个还是900个的争议(P32-35)导致冥王星最终被逐出行星行列,看上去自然的、客观的世界也因主观化而越发没有秩序了。

温伯格腹中装满各种故事,对我而言并不好懂。书中将世界秩序分成三个层次,却只是举例说明,并没有给出三个层次的定义。就好象提姆·奥莱理(Tim O’Reilly)文章“什么是Web2.0”,却只说七个特征并举一堆例子,并没有给出定义。本书明言“避开定义”(P190),另有一个小标题是“似乎、大致的世界”(P203),或许没有定义、靠心领神会就是这个时代的特征?
以我对那些故事的理解,三层秩序分别是:第一层秩序是经过组织的实体,那是人类最古老的整理方式。第二层秩序是以实体方式对这些实体加以描述;通过手工标引并组织元数据(可以计算机来组织),使第一层秩序的实体得以从不同角度获取进而利用,则属第二层秩序的较高层次,可以是实体的、也可以是虚拟的。图书馆所用的分类编目就是其中的佼佼者。
书中大量篇幅讲的是第三层秩序,也就是在打破秩序的数字世界里,任一对象都是智能叶片──可以同时挂在不同的枝干上。由此,使用者不管从哪里出发,都可以生成需要的结果,而不是必须遵从某种既定的、非此即彼的唯一体系,不管是林奈的生物分类体系(P72-78)、杜威的十进制分类法(P45-56)还是其他。miscellaneous有“多种多样的”的意思,世界万物原本有多种属性,源自亚里斯多德的树形结构(P69-72)应该不限定只入一个分支,现在是复归其多样性的时候了。

看完全书,想想组织数字世界的方式或可分成两类。一类是针对人的,搜集人在各处留下的痕迹并加以整理,所谓“在云层中寻找”(P167-170),让那些内隐的信息显性化(第八章“虚无的诉说”)。另一类是针对数字对象的,由参与者主动添加内容,比如社会网络的智能叶子──标签,把标引对象挂到不同的树枝上(或者把任何东西都当作元数据),然后由计算机来分析处理这堆标签,在使用者搜索的时候,不但提取这些标签,还根据标签分析结果提供各种建议。比如(P97)在Flickr上搜索带有“Capri”标签的照片,它会自动将搜索到的照片按意大利卡普里岛和福特卡普雷车区分开来。如果从情报学角度,使用受控词表可以实现这样的功能,但在Flickr中是通过分析人们为这些照片添加的标签为实现的。

西北图客介绍此书时说是“一本图书馆员最好不要阅读的书《新数字秩序革命》”(2009-01-03),因为书中有不少篇幅述及图书馆相关内容,如美国国会图书馆维护书目(P10-11),杜威十进分类法(P45-56)、ISBN甚至FRBR (P121-130),令人产生一度有效的图书馆组织实体资源的传统已经过时之感。不过,书中对阮冈纳赞及其冒号分类法还是相当的推崇(P80-82)──“该体系居然是在70年前,也就是计算机时代到来之前几十年,由一位图书管理员受到某种机械玩具的启发而发明的,这一点让人感到非常惊讶”。Endeca是书中所举第三层秩序时代使用此方法的成功实例(北卡州的新一代OPAC即由此公司提供)。
在数字时代,不只是图书馆界遭遇问题,很多学界也同样如此。就好象图书馆员无论地位还是形象,在全球都差不多,但我们就认定本国馆员最为不堪,这是没有任何道理的。任何职业都有宿命,有时并不源于自身。
不过,即使图书馆中的资料全都数字化了,至少目前这种“智能叶子”方法还不能解决所有问题,尤其是学术搜索的问题(可惜找不到书中的说法了),以LC参考馆员托马斯·曼为代表的反对派并不是无理取闹(可参见:“记录在案”走入歧途──对书目控制未来工作组报告的回应(2008-03-23))。或许在组织数字世界中我们还有努力的机会?
比如温伯格提出的组织知识的四条新策略(P105-108):
在出口建立筛选装置,而不是入口
将每一片叶子都放到尽可能多的树枝上
每样东西都是元数据而且什么都可以被当做标签
放弃控制
这四条策略,在传统的情报检索语言中貌似都能找到原型,分别是:后控、后组、自由词、非控

未来的技术是什么,RDF、本体、微格式到世界范围的语义网吗(P197-203)?
第十章末说:“世界不会一直保持杂乱无章的状态,因为我们在齐心协力把它变成属于我们的”。(P237) 我以为,群众的智慧、人海战术可以为数字世界添砖加瓦(标引),但最终的组织应该属于计算机。亚马逊的各种推荐(书中称为“联合筛选”)就是一个常被人提起的例子(P56-61亚马逊的嘉年华),新一代图书馆OPAC的借阅推荐、查询推荐也源于亚马逊的做法。
我是相信计算机处理能力的。我不认为MARC会安乐死,不是相信编目员可以天长地久,只是不相信死到临头再折腾出来的新框架会比MARC更有前途。雨僧不是在问么:“我们需要RDA吗?”(2009-01-30)虽然RDA只是AACR2(编目规则)的替代品,与MARC(机读目录格式)绝非誓不两立。

 

 

《新数字秩序的革命》戴维·温格格著,张岩译. 北京:中信出版社,2008. ISBN 978-7-5086-1292-8

捉刀记

    捉刀是一种非常普遍的现象。比如单位评先进,需要上报材料的,通常会叫被评部门或个人自己写,美其名曰你(们)自己最了解,其实内心是觉得,当先进已经够便宜你(们)了,还想让别人辛苦劳累?类似的,学生要老师写推荐,老师通常会让学生自己写,然后签上自己的大名──谁得益、谁劳动么。
    有的捉刀就不是这样了。比如领导们的秘书,那是工作,劳动者不是得益者。某百科全书式的著名学者,也是领导,其高产量不知现在是否还是全国第一,据说秘书无数,一个学科有一个学科的秘书。这样的高龄学者,多少著述出自己手,就不得而知了。
    还见到不少公开场合述及元老级学者,都说已XX高龄仍如何如何,令人在佩服之余,有时不由得怀疑其真实性。前几年,在QQ群里某网友称赞巴金已百岁,仍继续工作,任上海中国作家协会主席。其时,已经有好几年了,上海观众看到市领导逢年过节前往医院探望,电视画面只见领导、不见巴老。倒是不知道有没有替巴老捉刀的。
    今天看到11月30日的《上海盟讯》(http://www.minmengsh.gov.cn/shmx.asp)上一篇文章,应该是纪念上月以百岁高龄过世的谈家桢院士,不过是从另一个角度──“给谈先生写稿”,总结了作者替谈先生捉刀的漫长历史,从1989年冬(80岁)到2007年(98岁)。除了发言稿,还包括1993年谈家桢纪念毛润之的文章,“和以往一样,谈先生没提什么意见”。
    文章结尾处,作者感慨“给谈先生写稿,总的感觉就是两个字──舒服”。似乎不愉快的捉刀经历也不鲜见呢。
    该期报纸目前还没挂上网,过一阵应该可以下载全文

[update] 附记,不知道老毛的大名在博文中也是呼不得的。后台显示正常,大家看到的就是三颗星了。于是呢,嘿嘿,用“字”试试,OK啦!

《夜晚的书斋》中的图书馆员

    《夜晚的书斋》,图书在版编目的主题是“图书馆──通俗读物”,而原书"The library at night"在西文书目中的主题是“图书馆”、“图书馆──历史”和“图书与阅读──历史”。此书延续《阅读史》的风格,在东拉西扯之间,引入大量图书馆、图书与阅读的历史。
    漫谈图书馆史,不免涉及馆长。作者学生时代曾为博尔赫斯朗读(见《阅读史》p.18-22),这位曾提出“天堂是图书馆模样”的盲人馆长在书中便多次出现。
    在馆长们的众多见解中,印象最深的是300年前,德国著名数学家、哲学家兼法学家莱布尼茨(Gottfried Vilheim Leibnitz)已经说过,图书馆的价值只在于其内容以及读者对内容的利用,而不在于藏书的数量和珍藏的稀有程度。(p.84)

    因为是漫谈,所以在馆长的高瞻远嘱之外,还有各异其趣的普通馆员(小标题为本人所加):

造假
1990年代,由于旧金山图书馆新馆大楼没有足够空间来摆放书籍,市政当局决定从图书馆内撤出几十万册藏书,充当填土之用,凡长期无人借阅的书刊都以此种办法销毁。为了尽力挽救大量的书籍,图书馆的管理员表现出英勇精神,乘夜间偷偷进入书库,把虚假的出借日期印在即将清除的书本上。(p.67,出处:Nicholson, Baker, "The Author vs. the Library", The New Yorker, 14 Oct. 1996)

偷盗
在纳粹分子开始掠夺毁灭犹太图书之后,肖勒姆·阿莱汉姆图书馆(Sholem Aleichem Library)馆长决定尽力挽救这些图书。他和另一位馆员每天都从馆里偷偷带走一些书。两星期后这些书被移到一个秘密的阁楼里,直到二战结束后很久,才被历史学家波尔齐科夫斯基(Tuvia Borzykowski)发现。(p. 216)

无知
1930年穆齐尔(Robert Musil)描写一个勤恳的馆员在维也纳皇家图书馆工作,他熟悉这个巨大馆藏中每一本书的书名。“你想知道我是怎样熟悉这些书名的吗?”他对表示惊异的客人说:“我完全可以坦白告诉你,这是因为我一本书也没读过。”他又说:“每一个出色的图书馆员的秘诀就是,凡是委托他管理的书,一本也不要读,只记住书的名称和目录。只要钻进了书本,就会迷失方向,他就永远掌握不了图书馆的全貌了!”(p.232,出处:Robert Musil, Der Mann ohne Eigenschaften. Berlin :Ernst Rowohlt, 1930)

疯狂
法国女作家柯莱特的朋友保罗·梅森(Paul Masson)有一次到她海边别墅来,从衣袋中取出钢笔,一小叠卡片和一块写字用的木板,称“我被派到国家图书馆编目部工作,现在我要编书目清单。”她感到奇怪:“你凭记忆编目吗?”他解释说:“……我知道国家图书馆缺少15世纪的拉丁文和意大利文图书。我现在正在开出应当有人写的十分有趣的书名清单。……至少,这些书名可以给图书馆目录挣点面子……”。(p.257,出处:Collette, in Mes apprentissages. Paris : Ferenczi et fils, 1936)──此人后来自杀:站在莱因河边,鼻子里塞满浸透乙醚的棉花,失去知觉后倒在一英尺深的水中淹死。或许原就是图书馆中众多精神病患中的一员。

别样疯狂
1945年5月,当捷克爆发反纳粹起来,俄国军队开进布拉格的时候,作家纳博科夫的姐姐埃莲娜·西科丝卡雅(Elena Sikorskaja)正在图书馆工作,她知道德国军官准备逃走了,但他们借的图书尚未归还。她和一位同事决定把这些书要回来。她们穿行在俄军胜利前进的街道上去挽救图书。她后来写信告诉弟弟:“我们找到了德国飞行员的住处,借书的人冷静地把书还了。可是到那时候,主要马路止已经禁止通行了,到处都是德军架起的机关枪。”(p.294,出处:Vladimir Nabokov/Elena Sikorskaja, Nostalgia, letter of 9 October, 1945. Milano : Rosellina Archinto, 1989)

骑驴

哥伦比亚农村的驴背图书馆(p.209)。上图来自Flickr:BIBLIOBURRO
在YouTube找到的视频Biblioburro,很生动的农村流动图书馆(Biblioteca rural ambulante)活动:

还有Biblioburro 2,流动图书馆本部似乎徒有四壁。

夜晚的书斋 / (加拿大)阿尔贝托·曼古埃尔著;杨传纬译. 上海人民出版社,2008.8 ISBN 978-7-208-07644-0
The Library at Night / Alberto Manguel. 2006

附目录:
前言
书斋──神话 [巴别塔、亚历山大图书馆]
书斋──秩序 [目录学与图书馆目录]
书斋──空间 [百科全书、数字化]
书斋──力量 [卡内基]
书斋──影子 [禁书、毁书](介绍:禁书:图书馆的影子,《文汇读书周报》2008-08-29)
书斋──形状 [建筑,米开朗基罗设计建造佛罗伦萨的洛伦佐图书馆]
书斋──机遇 [敦煌]
书斋──工作室 [作家、博尔赫斯]
书斋──心思 [阿比·瓦尔堡图书馆]
书斋──岛屿 [鲁宾逊、驴背图书馆]
书斋──幸存物 [纳粹、十字军]
书斋──遗忘 [屠格涅夫图书馆、伊拉克国家图书馆]
书斋──想像 [博尔赫斯、拉伯雷、圣诞老人图书馆、希特勒藏书]
书斋──品格 [彼特拉克、国家图书馆、帕尼奇]
书斋──家
结语

参见老槐也博客:走近《夜晚的书斋》(2008-09-04)
关于《阅读史》,参见:空袭过后的图书馆读者(2008-09-14)