存档在 2006 年十二月

一周网络见闻2006-12-25:谷歌logo的圣诞连环画

2006年12月29日

本周大事是12·26台湾地震。本来与我们关系不大,赶巧那天正是老毛冥寿,有人说是老毛发威示警。老毛已去了四十年[update: 算错了,是三十年;是那个不可搜索的事件开始四十年],说有影响不过是借题发挥。但地震造成了网络中断,影响至今未消除。所以这一周在网络上也就没什么见闻了。

    本周一是基督教的圣诞节。好似我们过除夕,西方人过圣诞前夜,到了圣诞节这一天,好像反而没什么事了。Google今年的圣诞连环画到那一天也完成了。

谷歌logo的圣诞连环画

Google Christmas Logo 2006-1

Google Christmas Logo 2006-2 

Google Christmas Logo 2006-3

Google Christmas Logo 2006-4

Google Christmas Logo 2006-5

 

 

 

 

 

 

 

 

 

 

 

        Google去年有一组连环画,主角是北极熊一家,用Google logo染雪球为五彩冰淇淋球请客。今年的主角改成了袋鼠一家,你从中看到了什么样的故事?看看谷歌黑板报上又是怎么写的:“o 啦!!——“温”“心”圣诞”。

 

说明:上面的图片应该提供谷歌黑板报上链接的。由于网络故障无法访问黑板报,故直接上传图片。

update: 2007-1-21

Google网站上的2006圣诞连环画:http://www.google.com/doodle12.html

图书馆员:2007美国最佳职业

2006年12月25日

这世界变化快。记得年初,CNN的报道中,图书馆员名列美国最不受欢迎的工作(Five of the most unpopular jobs)。年末来了好消息,著名周刊《美国新闻与世界报告》(U.S News & World Report)选出2007年最佳职业25个(Best careers 2007),图书馆员与教授一同上榜。而当初最不受欢迎的5个职业中,有证护士、图书馆员和药剂师榜上有名。

    原因呢?或许正如当初CNN报道的副标题说明的:这些职业面临高质量员工短缺。薪水数据或许能说明图书馆员入选的原因:年初报道中,馆员薪酬中值接近47000美元,年末此值为49708美元,提高近3000美元,增长超过6%。

    最令人感兴趣的不是最差或最佳,这只是视角不同而已。令人感兴趣的是,在我们对自己职业前途看淡的时候,这条消息中对图书馆员这个职业的描述,感觉上不是记者写的,而是某个招聘员工的馆长或者深爱本行的馆员写的:

不要把图书馆员想象成乏味的书蠹。当今的图书馆员必须是高技术的信息侦探,帮助研究者探测图书与数字记录中存在信息的海洋。这是一个被低估的职业。大部分图书馆员乐于帮助客户挖掘信息,并从中学习新知。图书馆员还可以继续放肆决定购买什么图书与联机资源。他们甚至从事表演如儿童木偶,开展其他活动如成人读书讨论会。最重要的,图书馆员工作时间合理,而且不用说,工作环境安静。

Librarian: Executive Summary

Forget about that image of librarian as a mousy bookworm. Librarians these days must be high-tech information sleuths, helping researchers plumb the oceans of information available in books and digital records. It’s an underrated career. Most librarians love helping patrons dig up information and, in the process, learning new things. Librarians may also go on shopping sprees, deciding which books and online resources to buy. They even get to put on performances, like children’s puppet shows, and run other programs, like book discussion groups for elders. On top of it all, librarians’ work hours are reasonable, and the work environment, needless to say, is placid.

via: Stephen’s Lighthouse: US News & World Report

编书后索引:张琪玉《图书内容索引编制法》

2006年12月23日

    张琪玉先生近年致力于索引工作,近日见到其新著《图书内容索引编制法——写作和编辑参考手册》(化学工业出版社,2006年8月)。
图书内容索引编制法
    读书的时候,应该在目录学课中讲过单书索引,或许也提到过书后索引。但系统地讲索引,还是在检索课。检索课的索引,老师津津乐道的是CA的分子式索引、BA的生物分类索引或者穿空卡的元词索引、题内关键词索引之类特别、有趣也实用的索引,对单书索引尤其是书后索引,那是只字不提的。所以对于编制书后索引的技巧,一直很困惑。
    看完张先生此书,惑全解了。不知道国内之前是否有与之类似的著作,对我而言是首度见到。如先生一贯的风格,层次分明,注重细节,归纳齐全,列举动辄一二十条,让人叹为观止。
    封底介绍本书适合图书作者与编辑工作者参考,但部分内容对于普通作者而言,或许图书馆专业意味太强了些。如“3.2索引款目标目类型的选择”,除了单级标目,其他如多级标目、带说明语的标目之类,对于没有分类表、主题表使用与标引经验的作者,估计一看就晕了。

    除了内容方面,本书在以下两点上显得特别实用:
    第一,作为手册,专设一章“10 图书内容索引编制过程示例”,拿一本书的部分为例,几乎是手把手地教读者编制书后索引。
    第二,附有两个内容相同的书后索引,分别为简约方案与周详方案,让读者体会不同书后索引的特征以及使用感受。

    曾经在“读《百年文萃》之终篇”中为该书没有书后索引而感到遗憾,并引书中所收钱亚新转引的话“我以为一本好的书籍,假使没有一个好的索引,要失掉它一半的价值。因为没有这种指引的工具,不管是背诵或推想,要想将书中所包涵最精彩的思想和最动人的事迹使之再现,简直不可能。”
    当时自己认为,书已经出版,无法补救了。看张先生此书,才发现自己对索引的发展了解太少。“5.13.4 图书内容索引上网问题”中介绍台湾陈颖青提出,将索引脱离原书放在网上让读者需要时自行下载。张先生认为上网取代附于书后并不可取,但“对于学术价值较高、已经出版而不可能重印的图书,用此法补编内容索引,障碍最少,最易实现。将补编的索引放到网上供下载或查检,或许是可行的办法。”(p.107-108)
    有那么多人都在读《百年文萃》,而且好评不少。不知道读者中有否志愿者,为该书编一个书后索引,放到网上让大家共享?或者先投给什么杂志(比如《中国索引》,可惜是内刊),然后再上网。
    上网有很多选择,如开放存取的本专业电子文库E-LIS(http://eprints.rclis.org/)、国家图书馆的图书馆情报学开放文库(http://202.96.31.39/)。另外,厦门大学主办的“图书馆维基”(Library Wiki)也是个很好的选择,众人参与,可以将制作的索引进一步编辑完善。

P.S. 想买此书?去豆瓣看看哪家比较合适?  

一周网络见闻2006-12-18

2006年12月22日

一、Bestsellers
Life-Expectancy of No. 1 Bestsellers per Decade Studied
1950s (1956-1959) 16.4 weeks
1960s 21.7 weeks
1970s 13.9 weeks
1980s 7.2 weeks
1990s 5.5 weeks
2000s (2000-2005) 3.0 weeks

Average Annual Number of Novels To Reach No. 1 Per Decade Studied
1950s (1956-1959) 3.8 titles
1960s 2.8 titles
1970s 4.4 titles
1980s 7.6 titles
1990s 10.0 titles
2000s (2000-2005) 18.2 titles

New titles released (US)
1995 113,589
2005 172,000 (51.4% increase)

来源:Stephen’s Lighthouse: Bestsellers

Life-Expectancy of Bestsellers Plummets, Finds Study

结论:出版的书越来越多,畅销的书也越来越多,畅销的时间越来越短

二、有道是否有道?
有道博客搜索:http://blog.yodao.com

1编目精灵II(博客巴士)的博客档案

平均发文间隔:2天 最近更新时间:20061218

博客评语:“或许白天的嘈杂纷乱会分散他们的思路,夜色降临,思维才开始活跃、精神开始兴奋,一蹴而就一篇文章更不是难事。要是去年,博主就是著名的网络写手了。可惜现在人人皆博,这算不得什么厉害啦。虽然只是隔三差五的发表博客,但在彷佛不经意的遥控器换台中,却总能看到博主的近日行踪。”

习惯发文时间:22点 20点 15点
习惯发文星期:周六 周三 周一
发表文章长度:最长1928字 最短211字 平均712字

2编目精灵(博客网)的博客档案

平均发文间隔:1天 最近更新时间:2006820

博客评语:或许白天的嘈杂纷乱会分散他们的思路,夜色降临,思维才开始活跃、精神开始兴奋,一蹴而就一篇文章更不是难事。根据统计,博主习惯在周末发文。到底是周末才有时间回顾一周的故事,还是在周末才有惊喜和变化值得记录?仔细读读他(她)的博客就会知道。一句话,博主很能写!现在就把博主的博客文章全部集结起来,联系出版社准备发行《祥林嫂后传》吧。除了新闻联播的主持人和李敖,就属博主天天有话说了。

习惯发文时间:19点 0点 17点
习惯发文星期:周六 周日 周五
发表文章长度:最长3737字 最短1670字 平均2565字

问题:
1、为什么统计数据差那么多?
2、博客档案中的博客评语是怎么产生的?
答:博客档案中的博客评语是根据作者的发文习惯等信息由系统自动生成的。
3、自己动手
查一下自己的是不是被收录了?要不要让有道收录一下?

来源:
钱涂无量:有道的评语(http://www.qiantu.org/?p=659)[December 15th, 2006]
游园惊梦:有道(http://youmeng.bokee.com/5971035.html)[2006年12月19日 星期二 17:06]

看过知道,就那么几句话,比“搜狐文品测试”还不如啊。

三、向雅虎提问——雅虎捷径

Yahoo! 捷径旨在分析并识别关键字的意图,并根据意图将最有效的信息最直接,最快捷的返回给用户。到目前为止,上线的主要功能包括:天气查询、万年历查询、音乐、影视,为了方便大家的春节出行,即将发布的"列车时刻查询"也很值得期待哦。

问两个问题试试(限雅虎中文搜索search.cn.yahoo.cn):

明年春节是几号(不错,能够识别出“几号”)

上海这几天天气如何(可惜问“上海这几天天气好吗” 就不行了)

另外,雅虎也有单位换算,比如:

      1克拉=?

来源:雅虎搜索日志: 用户对搜索框的期望 http://ysearchblog.cn/2006/12/post_56.html

四、谷歌的搞笑

来源:G速客:Google Docs & Spreadsheets发布调查问卷

在这份调查问卷里,并没有特别的内容,无非就是让用户选择D&S的可靠性、满意度、易用性等等常规指标。不过当我填到后面,才发现Google有点(玩笑~):

Google调查选项

你什么时候开始用Google D&S的?选项中竟然有12个月之前的=.=

这令我想起有一次在某BBS里,某君为了表示自己精通Gmail的用法,吼道:01年就开始用Gmail了我还不懂?!如果我们没弄错,Google Docs & Spreadsheets是在今年1011日才正式上线的,这个名字也是那天才出现。

五、年终奖计算器

http://promotion.china.alibaba.com/yaward/step_1.html

“百万图书”项目(CADAL)相关信息

2006年12月18日

    曾经写过一篇博文,批评百万图书项目“数字化《四库全书》”。不过自己现在想法改变了,因为在国内简称CADAL的百万图书项目,把古籍、民国书刊之类没有版权限制的文献都放在公网上,让大家共享。此等做法,在国家资助项目中似乎难得一见,是好事当然要“顶”。
    竹帛斋主作为CADAL成员馆的住持,“温柔地”批评管理中心,自然有他的道理。而对于我等非成员馆,不能看现代图书是很能理解的,违“法”的事哪个敢随便做?

    Karen Coyle在文章“Mass Digitization of Books”(Journal of Academic Librarianship, v. 32, n. 6, 预印本)中把百万册图书项目称为Large-scale Digitization,对应于Google Books那样不做筛选的Mass Digitization。文中称该项目为“卡内基·梅隆百万册图书”(Carnegie Mellon Million Book project):始于2001年,在中国、印度和埃及数字化图书。由于项目宣称长期目标是“以数字化形式抓取所有图书”(The primary long-term objective is to capture all books in digital format),Karen称其为当今mass digitization运动的先驱。目前百万册图书项目已与开放内容联盟(Open Content Alliance)合作,加入到mass digitization运动中。

相关资料链接:

2001年报告:百万图书数字图书馆项目
Reddy, Raj and Gloriana StClair. The Million Book Digital Library Project. Carnegie Mellon University. (December 1, 2001)
http://www.rr.cs.cmu.edu/mbdl.htm

百万图书项目常见问题
Frequently Asked Questions About the Million Book Project
http://www.library.cmu.edu/Libraries/MBP_FAQ.html
其中有截至2005年11月的图书扫描数据:印度17万,中国42万,埃及2万;其中英语13.5万;大部分为没有版权的,6万余有版权,其中英语约5.3万,印度语言7千。

卡内基·梅隆大学图书馆网站上链接的三个网站:
1、百万图书中国网站:寰宇图书馆(Universal Library) http://www.ulib.org.cn
是中科院研究生院的,有些项目初期的信息,没有图书
2、百万图书印度网站:印度数字图书馆 http://dli.iiit.ac.in
有截止到2005年4月8日的统计信息,共5.7万册。
3、百万图书美国网站:寰宇图书馆(Universal Library) http://www.ulib.org
没有相关统计数据。
后两者有全文,安装AlternaTIFF(http://alternatiff.com/)后即可浏览tiff页面和txt文本。
埃及呢?只听说CADAL成员馆到埃及开会,没见到埃及在百万册书中的相关链接。

中国网站最新信息、全文浏览尽在CADAL (China-American Digital Academic Library):高等学校中英文图书数字化国际合作计划(China-US Million Book Digital Library Project)
两个名称,真让人困惑啊,如果再加上那个寰宇图书馆(Universal Library),就更困惑了。
http://www.cadal.net
http://www.cadal.cn
http://www.cadal.zju.edu.cn(看全文需要下载DjVu插件)

介绍百万图书项目的论文:
陈海英,竺海康:中美百万册数字图书馆项目综述
《大学图书馆学报》2005年第1期第3-6,13页