第四年的事

    年初的时候,游园、小钟弄了个“中文图林博客奥斯卡奖评选”,寒假过后公布了投票结果。四月在浙大举行第三次图书馆2.0研讨会,蓝天白云、超平让这个以用户参与方式评出的虚拟奖,变成了晶晶亮的实体。趁周末去杭州游会,拿到那几个漂亮的疑似水晶很开心,但心下一直以为属鸠巢雀占,也就不好意思大大咧咧地向众粉丝表示谢意。年终盘点想起此事,深感有负大家一片好意,就在此补谢了orz

    暑假时大学同学聚会,在图书馆界任职的了了。一个任职某地图书馆主管部门的同学说,另一位同学告诉她我的博客如何如何(相信是看我博客的唯一同学)。从言谈中我感觉到她并未看过,但她说在搜索引擎查我名字即可查到,这倒出乎我的意料。回家一试,雅虎、百度都在搜索结果首页都有博客中国的旧家,雅虎还排在第二位,但谷歌前五页没有。不同搜索引擎的关联、排序算法差别由此也可见一斑。

    由于博客网关门传言,而目前只有博客巴士提供博客网的搬家服务,估计会有不少人搬到大巴。大巴有收费VIP,因而免费用户服务受限。比如不提供单篇访问数,好在还有一个“访问量前三十的日志”排名(原来仅提供前二十)。
    本博访问量一直不高,搬家二年多,上周访问量刚过12万。由于页面与RSS都提供全文阅读,与当年在博客网时相比,单篇点击率低得可怜,三四百就进了排名,最高也不过二千多。估计那些访问都来自搜索引擎,因而从排名可以了解大众(而非本博的小众常客)关注的议题。
    今年可以想象的关注议题是地震。5.12大地震后曾停博数日,而后所写的“除了捐款,我们还可以做什么?”及“地震堰塞湖”,访问量很快进入前十,目前仍在前二十之列。
    目前位居第十的是“读者服务礼仪──微笑”,这篇针对中图学会第四届青年学术论坛而写的YY文,竟然能排名这么靠前,有点不可思议,原因不明。
    最让自己最哭笑不得、以至想让诸位看客一猜的是:这一年所写博文中访问量最大的是那篇?这当然太过自恋了,不如自爆──0131是哪里的区号?。自从8月23日发表后,随即在“最近来源关键词”中频频见到它的踪影,接着眼见它进入访问量前二十,然后“天天向上”,到今天,已然稳居第四,正向第三进发。从这个几乎与社会无涉的Blog,竟然也能折射出骗子满天飞的可悲现实。

    上周看到一文,称“个人博客已经死亡?”──那些还在写着个人博客的人,比起使用facebook、youtube、twitter的人来说,你们更像是活在2004年的"活化石"。
    我偶而看别人的twitter,但自己不用。我在youtube上搜视频,但不上传、也不参与点评。我注册了facebook,但很少使用。这些社会化网站在中国有不少克隆的,我的参与度更低。
    我呢,就是那活在2004年的活化石,今天是我的四岁生日。

参见:
周年盘点:图情流行缩写词一瞥()(
两岁了
三周年 & My Presentation

关于“中文图林博客奥斯卡奖评选”,参见:
图林博客粉丝大比拼 (2008-01-17)
图林博客粉丝大比拼·结果篇 (2008-02-26)
“Web/Lib2.0”第三次研讨会博客颁奖 (2008-04-15)

网上的科文杯情报搜索大赛试题

    科文杯情报搜索大赛凌晨已经结束。大赛开始前,在本博上附带做了一次广告。后来在本馆的最新消息中,也做了面向读者的广告,并且设定在大赛开始的时间发布,免得性急的人白跑一趟,过后又忘了。后来听说有读者在咨询中问搜索大赛的题目,可见也是有一定效果的。
    除了向同事推荐,因为好奇有些什么题目,自己也在第一时间注册下载,打开文件看一眼,好难啊!接着继续上班干活。晚上见到keven邮件,其中有一句“将来总结时也需要向您咨询”,看到这样的客气话,正好借机不再做题。
    周末忙完一些事,有点空,又想到这些题目,便拿出来试试当年引以为豪的“情报检索”知识还剩几分。题目都需要拐些弯才可能找到答案,做起来很花时间。只做到第15题,其中两题觉得没有很好的思路被搁在了一边;其他有做到一半,因为网络原因还没得到最终答案的;也有做完的,但也不能全部确认是正确的答案。
    在家凭空做,除了各种专门网站,自然离不开搜索引擎,于是,就发现这些题目真是在网上满天飞啊。结论是,这次大赛还是有影响力的。如果收到的答卷不多,只是因为题目太难了,当然先期关闭试题下载的规则也有一定的负面影响。而那些不求最好、重在参与的交卷者就有福了,毕竟奖品丰厚啊!

    尽管在竞赛试题开始前的说明中有“本试题版权属于上海图书馆上海科学技术情报研究所,由“上海图书馆网上联合知识导航站”监制,任何单位和个人未经允许,不得以任何形式发布,否则将被追究。”,但发布数小时后,即在2008-10-10 13:34被人全文(包括上述警告语)转贴到档案管理杂志社主办的“档案界”网站论坛的图情博览版块。玩游戏不遵守规则,在此就不提供链接以免提升其网站排名了。
    另外有全题转贴的,也有贴上自己做不出的若干题的,更有大量的是单题贴到各论坛求助的。据说开赛不久,天涯上就出现了提问,而后百度知道之类的通俗征答网站更是提问不少。一般都会得到答案,而且不只一个,正确与否就不得而知了。并且最重要的是,大部分情况下,由于问者只是照贴题目,答着也就只提供答案,所以得到答案也未必能够如要求的那样“答题除提供答案外,还必须提供可被验证的出处或者获得渠道”。
    见到最专业的回复是某人在国学数典论坛上提问,同样是简单的提问,不但得到有出处的解答,而且是翻译的。问者能找到专业论坛提问,而答者也在数小时内回复,且尽显专业素养,真是一对好兄弟。感兴趣可前往一读。不知最终有多少应试者提供的是这个答案,也不知道提供这个答案给不给分──国内未必找得到朝鲜总督府编的旧日文版《朝鲜人名辞书》,至少上图网上书目中未找到──不过,如果答者翻译无误,不给分大概也找不出道理。

    人肉搜索时代,我们就是这样参加比赛的。

PCC实施废除440字段

合作编目项目(Program for Cooperative Cataloging)发布“PCC Guidelines for Field 440”(1页PDF),建议成员馆从2008年10月24日起废除440字段,以490 1代替。

490字段第1指示符“1”的新定义:
1 – Series traced in 8XX field
New Definition:
When value “1” is used, the appropriate field 800-830 is included in the bibliographic record to provide the series added entry.

改变440字段的建议早在6月6日即已提出(MARC Proposal No. 2008-07)。背景声称是由于440字段既是丛编描述又是规范检索点,其实这又有什么关系呢?LC不再维护丛编规范记录,使440没有存在的根基才是真正的原因。讨论中曾想取消490 1,但由于大多数图书馆的丛编索引取决于490第1指示符,最终确定从文字上修改第1指示符“1”的定义。
如果取消490 1,对编目员来说就省事了,直接在8XX字段著录就是了,而按现在的决定,是要在8XX重复。大部分情况下,书上的丛编描述与丛编规范是一致的。

由于丛编规范名不再存在,同日提出的另一项与之相关的建议(MARC Proposal No. 2008-06)是在800-830及490中增加$3,说明所用丛编名适用的范围或时段。看实例比看说明省事得多:
例一:
830 #0 $3 1980: $a DHEW publication $x 0090-0206
830 #0 $3 1982- $a DHHS publication $x 0276-4733
例二:
830 #0 $3 <May 1986-> $a Tourism research series.
例三:
830 #0 $3 v. 1-8 $a Collection Byzantine $x 0223-3738
830 #0 $3 v. 9 $a Collection des universités de France $x 0184-7155
例四:
490 1#    $3 <1981->:  $a Reference works
830 #0    $a Reference works.
例一、例三的两条830字段应该是分别出现在两条不同的书目记录中的,而例四的则是同一书目记录中的两个不同字段。由此也可以看到490与830其实是完全一致的。

via Catalogablog: Field 440

背景:
2006-4-20 LC宣布停止对丛编的规范控制,2006-5-1 实施
网上反对签名达 3495 个
2006-5-4 LC宣布推迟到2006-6-1实施
2006-5-11 LC专业人员协会执委会通过“对LC管理层停止生产丛编规范记录生产的决议”
2006-6-1 LC停止创建丛编规范记录