第四年的事

    年初的时候,游园、小钟弄了个“中文图林博客奥斯卡奖评选”,寒假过后公布了投票结果。四月在浙大举行第三次图书馆2.0研讨会,蓝天白云、超平让这个以用户参与方式评出的虚拟奖,变成了晶晶亮的实体。趁周末去杭州游会,拿到那几个漂亮的疑似水晶很开心,但心下一直以为属鸠巢雀占,也就不好意思大大咧咧地向众粉丝表示谢意。年终盘点想起此事,深感有负大家一片好意,就在此补谢了orz

    暑假时大学同学聚会,在图书馆界任职的了了。一个任职某地图书馆主管部门的同学说,另一位同学告诉她我的博客如何如何(相信是看我博客的唯一同学)。从言谈中我感觉到她并未看过,但她说在搜索引擎查我名字即可查到,这倒出乎我的意料。回家一试,雅虎、百度都在搜索结果首页都有博客中国的旧家,雅虎还排在第二位,但谷歌前五页没有。不同搜索引擎的关联、排序算法差别由此也可见一斑。

    由于博客网关门传言,而目前只有博客巴士提供博客网的搬家服务,估计会有不少人搬到大巴。大巴有收费VIP,因而免费用户服务受限。比如不提供单篇访问数,好在还有一个“访问量前三十的日志”排名(原来仅提供前二十)。
    本博访问量一直不高,搬家二年多,上周访问量刚过12万。由于页面与RSS都提供全文阅读,与当年在博客网时相比,单篇点击率低得可怜,三四百就进了排名,最高也不过二千多。估计那些访问都来自搜索引擎,因而从排名可以了解大众(而非本博的小众常客)关注的议题。
    今年可以想象的关注议题是地震。5.12大地震后曾停博数日,而后所写的“除了捐款,我们还可以做什么?”及“地震堰塞湖”,访问量很快进入前十,目前仍在前二十之列。
    目前位居第十的是“读者服务礼仪──微笑”,这篇针对中图学会第四届青年学术论坛而写的YY文,竟然能排名这么靠前,有点不可思议,原因不明。
    最让自己最哭笑不得、以至想让诸位看客一猜的是:这一年所写博文中访问量最大的是那篇?这当然太过自恋了,不如自爆──0131是哪里的区号?。自从8月23日发表后,随即在“最近来源关键词”中频频见到它的踪影,接着眼见它进入访问量前二十,然后“天天向上”,到今天,已然稳居第四,正向第三进发。从这个几乎与社会无涉的Blog,竟然也能折射出骗子满天飞的可悲现实。

    上周看到一文,称“个人博客已经死亡?”──那些还在写着个人博客的人,比起使用facebook、youtube、twitter的人来说,你们更像是活在2004年的"活化石"。
    我偶而看别人的twitter,但自己不用。我在youtube上搜视频,但不上传、也不参与点评。我注册了facebook,但很少使用。这些社会化网站在中国有不少克隆的,我的参与度更低。
    我呢,就是那活在2004年的活化石,今天是我的四岁生日。

参见:
周年盘点:图情流行缩写词一瞥()(
两岁了
三周年 & My Presentation

关于“中文图林博客奥斯卡奖评选”,参见:
图林博客粉丝大比拼 (2008-01-17)
图林博客粉丝大比拼·结果篇 (2008-02-26)
“Web/Lib2.0”第三次研讨会博客颁奖 (2008-04-15)

开放中的中国国家图书馆

    以前,感觉中国国家图书馆的定位就是北京市的公共图书馆。为满足北京市民进阅览室读报看书自修而弄得焦头烂额,为业界及广大学界服务的主业似乎变成了陪衬。这几年,通过网站上提供的种种资源与服务,这种情况改变了很多,京外人士也能享受到国图的服务了。总的感觉是越来越象国家图书馆了。

    前些日子在第三届上海地区图书馆2.0会讲“建设开放的图书馆”,前一半时间是在称赞国图(其博客不在称赞之列)。虽然如手机服务不是开展最早的,但很有要做就做到最好的气势。内容整合与开放,也对大型图书馆具有示范作用。

    国图网站是个富矿,注意去挖掘,会发现很多有价值的内容。自己一直在向读者推荐国图的民国资源,尤其是其中的民国期刊,是国内开放最完整的。昨天遇一古籍部同事,讲到国图的碑帖(金石拓片),也很是称赞。据她说,原来很多图书馆的碑帖著录就像图书一样,信息过于简单。国图开放了数万件碑帖的图片与元数据,很具示范作用,现在大家都跟着国家图书馆,逐渐学会怎么揭示碑帖元数据。

    忘了在哪次会上,听国图数字化工作介绍,依稀记得是说目前放在网上的资源只是已经完成数字化的十分之一。新网站上特色资源的介绍是:
    “国家图书馆自2000年开始进行馆藏资源的数字化加工工作,目前自建数字资源内容涉及中文电子图书博士论文民国文献在线讲座在线展览甲骨实物与甲骨拓片敦煌文献金石拓片地方志西夏文献年画音像资源等,包括文本、图像、音频、视频等多种类型,资源总量达130TB,其中全文数据内容已达到1.2亿页。
    本特色资源库,以国家图书馆自建特色数字资源为主,实现网络发布资源总量已达4.01TB。本库文献涵盖了中文图书、博士论文、民国文献(图书、期刊和法律)、音视频、数字方志、甲骨实物与甲骨拓片、金石拓片、西夏文献、年画、中国学数据库等。为了方便读者使用,系统通过整合各种资源库,实现了对多种类型资源的跨库检索。读者可以在线或到馆检索、浏览、阅读这些资源。”
    原来开放的只是个小零头──自然盼望着可以在国图网站看到更多的资源。民国图书方面,目前CADAL有走向封闭的迹象,未来或许只能寄希望于国图了。

    当然,如果以美国国会图书馆(LC)为标杆,国图还有更多可向业界开放的内容。
    以自己比较熟悉的编目领域为例:LC的MARC标准网站,从很久以来的简明版到目前的简明版、完整版并置,还提供众多相关内容,以至论坛(邮件讨论组)供大家讨论;LCSH开始了面向机器同样也面向人的试验服务lcsh.info;书目记录更是一惯提供开放的Z39.50服务,受益全世界。
    前一阵子,青树教育基金会想为贫困地区学校图书馆做自动化管理系统,向我了解国内的Z39.50服务器信息。以往知道的的那些服务器,现在是连简编记录都关闭了。后来一网友在某处留言,告知辽宁图书馆是开放的,试了一下,虽然只是简编记录,也聊胜于无了。
    因此,很期待国图有朝一日也能如LC那样,开放分类主题词表,使《中图法》也能在网络资源组织中取得一定的位置;开放CNMARC,让国内外都能了解我们的MARC标准;开放Z39.50服务,让所有图书馆都能方便地使用国图的书目记录建立自己的目录,尤其是那些贫困地区、刚开始建图书馆、建自动化管理系统的小馆。

参见:
大旗底下:国图博客,赞一个先!(2008/09/07)
国家数字图书馆标准规范建设 (2008-09-26)
上海地区第三届图书馆2.0会议点滴·附科文杯情报搜索大赛广告 (2008-10-09)
           [PS:请抓紧搜索大赛的答题,马上就要截止了,据说目前奖品仍然多多]
广告:Koha开源社区·中学图书馆志愿者 (2008-09-06)

道听途说、瞎三话四

    像范仲淹那样,“不以物喜、不以己悲”,是很难修炼的。天太黑,心情也一样,摆些道听途说,瞎三话四。

    年前家父手机积分,换来二箱售价不菲的特伦苏。只怪自己没有尽早告知父亲该奶会致癌(转广东奶协秘书处:蒙牛特伦苏牛奶事件备忘录牛奶新闻管制史话——蒙牛特伦苏牛奶事件备忘录),最后硬着头皮陆陆续续喝掉了。无它,只因日常饮食中摄入的有害物质不可胜数[update 2008-9-24 加两组吓唬人的图:五毒教重现江湖看你还敢吃什么],如果一有风吹草动就不碰,恐怕连西北风都没得喝(不要告诉我城市空气指数优良率)。有人告诫“比三聚氰胺更可怕的会是抗生素”,我也没辙,死就死吧,我也不想到一百才挂上墙

    由于三鹿有个新西兰的大股东恒天然公司( Fonterra)(揭发三鹿奶粉丑闻的幕后英雄--新西兰政府),让大家一下子长了很多知识,于是对三聚氰胺避之唯恐不及。其实中国人没那么娇嫩──没钱,娇嫩不起来。我小时候,牛奶计划供应,每天只有一瓶奶,其余吃“奶糕”,也活过来了。现在农村还不一样?“中国人,也根本就是喝不起那种百分百纯正的牛奶的”(人穷志短,废话少言)。价廉物美,哪有那样的好事?
    城里人偶尔也能享受“物美价廉”,是因为“中国的农民不仅补贴城里人,还在补贴全世界,一旦有些人呼吁说要提高粮价给农民实际的好处,立刻有人站出来反对说:即使提高粮价,农民也不会得到什么好处的,所以还不如不提高。”(毒奶粉事件本质是三农问题
    有福的人更可享用“特供产品”──云影说是“贡品”,我怎么以前就没往这儿联想呢──那就不用担心有毒有害物质了(祝咏兰主任在中央国家机关特供产品授牌仪式上的讲话)。除了往这方面努力,如果要继续呆在中国的话,实在想不出还有更好的改变饮食环境的方案。

    质检总局说,供应奥运的乳制品没问题。都喝下肚里了,如何知道没有问题?既然能够保证供奥的没问题,为啥老百姓喝的不保证呢?(李长江:从前没考虑过检测奶粉中的三聚氰胺
    想来供奥与进贡是同等的。百姓如草芥,中国那么多人呢,正好控制人口。

    三鹿的三聚氰胺含量是二千多,显然是故意添加的。在一片打假声中,质检总局发布专项检查结果,但所用高效液相色谱法( HPLC)的最低定量限为2.0 mg/kg,对于三家低于此限的品牌,存在误检的可能性,却未用气相色谱质谱联用法( GC-MS)检测。与之前放任不管对照,同样过于轻率,毕竟关系到企业的声誉与成败(方舟子 : “三鹿奶粉”事件中的数字问题)。

    此次几家奶业巨头无一幸免。新浪收了伊利的好处,把Search Engine Optimization提升为Search Engine Omission(与时俱进的SEO:Search Engine Omission?)。百度呢?三鹿公关方案曝光,百度声明:从未答应屏蔽三 鹿负面新闻,听上去很义正词严,却也能从中得知一些互联网业的潜规则。

    现在的网管比以往厉害多了。三年前反日游行,写了篇帖子也没怎么嘀。三年后地震,贴了几张网页截图,没几天就被删了。这次三鹿事件,各处被删掉的内容也不少了(无人负责)。耄耋少年想不通(真的不明白),我想得通。删就删吧,写过算数。