读《元数据》(预告篇)

    曾说了很多次编目员宜转型做元数据图书馆员,其实自己对元数据所知甚少。做花生壳“关于内容编码体系及规范控制的问卷小调查”,弄得自己信心全无,于是说她的问卷题目不厚道,其实是宣称自己很无知。

 

    最近开始读曾蕾与秦健教授的Metadata,感觉这本教科书对我这样只有零碎的元数据知识的读者,很是适用。比如以往对Keven常挂口中的“应用纲要”没有任何感觉,现在总算理解了。再比如,刚开始接触数字图书馆时,发现到处都是“最佳实践”或者“良好实践”,现在也多少知道其语境了。自然,花生壳眼里的基础题现在也难不倒我了。
    因此,大言不惭地说,作者真是送对人啦 🙂 虽然书到手两个月才开始读,到现在为止还只看完第三章(阅读速度每晚10页左右),并且其余的一多半看来还要过些日子才会继续读,感觉很是对不起两位 🙁
    全书看完,将写读后感若干,先做广告在此。

参见:《元数据》与metadataetc.org (2008-07-12)

《新数字秩序的革命》语录(笔记之三)

 

 

《新数字秩序的革命》戴维·温格格著,张岩译. 北京:中信出版社,2008. ISBN 978-7-5086-1292-8

 

 

    亚马逊网站自身同一家遵从杜威体系的图书馆之间的距离也是人类所能达到的最远距离了。(P60)

    杜威的目的是绘制知识地图……杜威体系……真正的问题是任何一种知识地图都假设知识存在地理特性,具有组织严密的结构并且是有形的。这个观念在第一及第二层秩序中还是说得过去的。但是,它却无谓地妨害了第三层次中杂乱无章秩序的作用。(P61)

    阮冈纳赞充满神秘色彩的体系却有一个使其在基于计算机的系统中空前强大的特性:没有哪个方面必须被当做“根本”。计算机不需要事先确定“适当的”树形结构应该是什么样子的,而是可以根据与用户的互动来即时建构树形图。(P82)

    秩序掩盖的信息通常比它所揭示的要多,这是一个基本事实,而这个事实本身也被这个世界的组织艺术和科学掩盖了。我们就像盲人摸象寓言中摸象的盲人……(P91)

    到底哪个群体得到了资金支持可以决定这个社会到底相信什么,而资金却常常是由那些不像专家们那么博学的人提供的:DNA研究中心的命运可能会由国会议员们来决定,而这些人甚至无法区分核糖体(ribosome)和长号(trombone)。(P104)

    当庞杂多元的体系动摇了我们对知识本质的认定,处于危机中的不仅仅是目录卡片的未来。(P104)

    长久以来,我们都依赖专家来过滤和组织信息,避免为那些不值得花时间的事情浪费光阴,并为自己的信仰找到一个坚实的基础。(P136)

    一切自称保持中立的机构,不过是打着中立幌子来保留其势力和特权。(P140)

    知识存在于联系和鸿沟当中,需要你的积极参与。(P150)

    社会交往图表的混乱程度常常可以用来衡量一家公司的创新能力。(P189)

    要是我们一开始都必须定义主题的话,就没有哪个单独的课程可以在这所大学或者其他任何一所大学里开设──埃诺莉·罗施(加州大学伯克利分校心理学系教授)(P191)

    在多元杂乱的世界中,知识同非知识的距离最多也只有一个链接之遥。……知识还能够保持其特权地位吗?(P211)

    有人将互联网当做一个人人都可以平等地发表自己看法的地方,而这种看法只是一个乌托邦式的美好理想,是由那些愚蠢的思想家和正在渐渐老迈的嬉皮士做出的空洞的承诺。(P212)

    网络对话看起来很像是回音室……旁观者会认为那是一群想法一致的人在相互肯定对方的看法。但是,这样的观点其实是错把谈话的基础看做谈话本身了。通过站在同样的基础上沟通彼此的不同意见,我们才最终实现了理解。(P213)

    在拉丁语中有这样一个谬误──诉诸权威谬误,这提示我们,我们不能够因为一个人在某个领域是专家就认为他的看法在其他领域也是可靠的。……某个专业领域的范围大概跟图书馆里一个书架的图书涵盖的范围差不多大。(P215)

    在《大英百科全书》中,篇幅是一种标记重要性的符号,而在维基百科,篇幅体现的是兴趣和热情的强烈程度,即使这种兴趣和热情只属于一个人。(P218)

关于语义网
(语义网络、RDF、本体)此类项目再次创造出了传统的知识分类方法所面临的问题:人类的话题实在是太庞杂太模糊了,根本就不可能被装进哪一套框框里!(P201)
语义网络还需要我们用将来时态来讨论,是一种“要是可以实现一定会很酷”的东西──菲尔·温德利(社交网络公司Utah前首席信息官)(P203)
建立一个世界范围的语义网络是个过于野心勃勃的抱负,它同样无法解决困扰了杜威分类体系和其他大型分类法的问题。(P203)

《新数字秩序的革命》中的图书馆学史八卦(笔记之二)

读书时应该没有上过《图书馆学史》这样一门课,但各门专业课程都会涉及学史。那时没有八卦,对于学界先贤前辈,教材不用说,老师上课论及时也都会带着崇敬的口吻,往往不会提及那些有意思的事实。《新数字秩序的革命》中有不少图书馆学史内容,看作者从学界外角度谈论,就很有些意思了,讲课时当学生打瞌睡时做调节剂应该是不错的。[update 2014-3-30:作者现在也可算图书馆界人士了,在其多个身份中,有一个是哈佛法学院的哈佛图书馆创新实验室共同主任,见维基百科词条:David Weinberger]

第三章“知识和图景”的前半部分(P43-56)几乎就是近代编目简史,以杜威为中心。
“杜威……不但领导了组织图书馆的运动,还领导了简化拼写、普及速记,以及推广公制运动。所有这些努力都试图通过标准化来消除低效率和浪费,比如说减少写“through”而不是“thru”所浪费的时间……杜威在1879年把自己的姓名由Melville Dewey简化成了Melvil Dui。在被任命为哥伦比亚大学图书馆首席管理员之后,他又把自己的姓改回Dewey,但是名字还是坚持使用Melvil这种拼写”。如果杜威的努力成为现实,我们现在背英语单词的效率将大大提高。
杜威开始创建他的分类法还是个21岁的在校大学生。“可以想见,当这些人听说这个去年还是他们学生的毛头小伙子现在要创造出一个涵盖知识体系中所有可能主题的组织体系时,都充满怀疑,认为这一切非常可笑。不过,还是有几个人答应了他的请求……”。
“杜威早就痴迷于十进制了。……他甚至对自己的出行进行了刻意的安排,这样他就可以在每个月的10号、20号或者30号到达,这简直是对理性主义的迷信。”

第四章“合与分”之“生活中列表的奥秘”(P66-68)讲博尔赫斯杜撰的百科全书类别。这位盲人作家虽曾任阿根廷国家图书馆馆长,但与图书馆学史无多大关系,不过令人吃惊的是,他不但能把天堂想象作图书馆的模样,还杜撰过一部更令人无语的“中国分类法”。
“博尔赫斯所作的《约翰·威尔金斯的分析语言》一文……中,博尔赫斯创造了一部中国百科全书《天朝仁学广览》,这本书将动物分成如下类别:
    (a)属于皇帝的,(b)涂香料的,(c)驯养的,(d)哺乳的,(e)半人半鸟的,(f)远古的,(g)放养的狗,(h)归入此类的,(i)骚动如疯子的,(j)不可计数的,(k)用驼毛细笔描绘的,(l)等等,(m)破罐而出的,(n)远看如苍蝇的。

第四章“合与分”之“无纸树形图”部分(P80-82)专论阮冈纳赞,包括“图书馆学五原则”及冒号分类法。
冒号分类法源自这样的钢件结构玩具,相信不少小朋友都玩过:

阮冈纳赞在伦敦的时候,“在萨费奇(Selfridge)百货公司看到了一套正在展出的Meccano拼装玩具”,他“花了整整一个小时的时间来观察不多的一套基本元件如何组成各种不同类型的玩具”。“他由此提出了五个基本的分类领域,或者说方面:本体、物质、动力、空间、时间”。
“阮冈纳赞……是个谨小慎微的人,在开始炒菜之前一定要把所有材料都摆成一排。在准备旅行的行李时,他会在装箱之前称量每一件物品以确保行李不会超重。他每天的时间安排都是一成不变的,据传有一位入室窃贼曾经据此成功策划了一场历时15分钟的入侵”。没想到印度男人也下厨,或者阮氏属于那种“好男人”。
“阮冈纳赞也有着非常不理性的一面。他会扶箕占卜,还去拜访印度教宗师。他拜访的一位宗师就居住在一个山洞中,而且,据阮冈纳赞的儿子说,‘此人浑身上下除了长长的胡子和菩提子念珠之外不着寸缕’。……阮冈纳赞希望图书管理员都相信超自然的精神力量,利用自己的直觉来分类图书。”

第七章“社会知识”之“控制的难题”起首部分(P135-136),到了当代图书馆时期,讲述的是2005年戈曼出任ALA主席前在Library Journal上对博客的负面评论及引起的论战,反映数字时代权威的失落感。相关背景可参见:
数图研究笔记:Michael Gorman最近有点烦(02月 27th, 2005)
美国版“我是博客”:Blog Person (2005-3-17)

另,第八章“虚无的诉说”提到,使用空格将单词分开是8世纪人们才想出来的办法(P155)。不说句读,中文至今还没有这种分开单词的方法,以至“分词”成为计算机自然语言处理领域一个不小的难题。

 

 

 

 

《新数字秩序的革命》戴维·温格格著,张岩译. 北京:中信出版社,2008. ISBN 978-7-5086-1292-8