一周网络见闻(20070312)

本周内容太丰富了!

一、Good guess
美国图书馆界一位名人,应国会图书馆邀请作会议发言,地点在Google公司总部。他问:

What do you think was cooler to my 8-year old Emma and 5-year old Eli–that I was invited to give a talk by the Library of Congress or that I was going to Google?

Via: Hectic Pace: Bibliographic Control Meeting

二、SEO作弊手段知多少?
SEO = Search Engine Optimization

做SEO必须了解基本的作弊手段,目的是避免无意间采用了相关手段遭到处罚。以下是被视为作弊的常见手段:
1、关键字堆砌:
为了增加关键词的出现频次,故意在网页代码中,如在META、title、注释、图片ALT以及 URL地址等地方重复书写某关键词的行为(Stuffing)。
2、虚假关键词:
通过在META中设置与网站内容无关的关键词,如在Title中设置热门关键词,以达到误导用户进入网站的目的。同样的情况也包括链接关键词与实际内容不符的情况。
3、隐形文本/链接:
为了增加关键词的出现频次,故意在网页中放一段与背景颜色相同的、包含密集关键字的文本。访客看不到,搜索引擎却能找到。类似方法还包括超小号文字、文字隐藏层等手段。隐形链接是在隐形文本的基础上在其它页面添加指向目标优化页的行为。
4、重定向(Re-Direct):
使用刷新标记(Meta Refresh)、CGI程序、Java、Javascript或其它技术,当用户进入该页时,迅速自动跳转到另一个网页。重定向使搜索引擎与用户访问到不同的网页。
5、偷换网页:
也称”诱饵行为(Bait-&-Switch)”,是在一个网页成功注册并获得较好排名后,用另一个内容无关的网页来替换它的行为。
6、复制站点或内容:
通过复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为。镜象站点(Mirror Sites)是此中典型。
7、桥页/门页(Bridge/Doorway/Portal/Entry):
针对某一关键词专门制作一个优化的页面,链接指向或重定向到目标页面。有时候为动态页面建立静态入口,或为不同的关键词建立不同内页也会用到类似方法,但与桥页不同的是,前者是网站实际内容所需而建立的,是访问者所需要的,而桥页本身无实际内容,只针对搜索引擎作了一堆充斥了关键词的链接而已。
8、隐形页面(Cloaked Page) 指同一个网址下对不同的访问者选择性返回不同的页面内:
搜索引擎得到了高度优化的网页内容,而用户则看到不同的内容。
9、重复注册:
违反网站提交纪律,突破时间间隔限制,将一个网页在短时间内反复提交给同一个搜索引擎以获得收录的做法。
10、垃圾链接:
加入”链接工厂”(亦称”大量链接机制”)指由大量网页交叉链接而构成的一个网络系统。一个站点加入 “链接工厂”后,一方面它可得到来自该系统中所有网页的链接,同时作为交换它需要”奉献”自己的链接。籍此方法来提升链接得分。
11、包含指向作弊网页的链接:
这种情况,有的是无辜被作弊网页牵连,有的则是桥页之故。

摘自:花了500学的seo课程教程笔记公布

三、美国童子军·挣钱与花钱

“据童子军网站介绍,美国许多成功的企业家,都是从在童子军卖饼干开始的。童子军的差使是推销饼干,目的实际是要培养孩子的社会和经营技能。饼干卖完了,大家凑在一起算账,让孩子们讨论钱该怎么花。结论是把钱一分为三,第一部分给组织者,因为人家义务劳动,还要自己缴钱,不公平,所以孩子希望能把志愿者倒贴进来的钱给付了;第二部分捐给那些无家可归者;第三部分留下来给孩子们开个庆功会。这样是非常”草根”的教育:什么都不是白来的,必须是自己挣来的;挣来钱后,再要想想世界上”三分之二的受苦人”。这是小处,却更让人见出真义。”

摘自:薛涌:反智的书生:草根对特权生气

四、parking lot clock
Library Plaza's Clock
The strip mall where the Library is located is actually called “Library Plaza.”
From Flickr. Uploaded on February 1, 2007 by The Shifted Librarian

Via: Library Views 圖書館觀點:圖書館的願景

五、知道π日(Pi Day)吗?还有两个呢!
摘自:Mild Talk:今天是“派”日(http://mopa.blogbus.com/logs/4763093.html

“美国的旧金山市可能是π日的最早发源地。每年的3月14日,在当天下午1点59分,热闹的人群要围着当地的博物馆绕行3.14圈——象征 3.14159……,这叫π游行,同时,人们手里还要拿着各种各样的饼,因为饼的英文Pie在英语里与π同音。日前在科学探索博物馆的官方网站 exploratorium.edu上,第19届π日庆祝活动http://www.exploratorium.edu/pi/pidaysched.html已经公布,包括互相投掷馅饼大赛。”
“因为π这个数字在我们生活中不可小觑的作用,全世界的数学家便在这一天,很巧的是,阿尔伯特·爱因斯坦也是在这一天出生,举行庆祝活动。我们喜欢吃 “派”,还有菠萝,因为菠萝的英文pineapple首音节与“派”相同,或者看《派》这部电影。而新近又一种奇妙的说法是,IT业的发展应该从π的研究时就开始了,祖冲之可以算IT业的祖师爷。为什么呢,如果把IT合写成一个字母,是不是很像π?”
“如果”π“节激起了你对数字的兴趣,那你一定要留意下一个π日:7月22日。因为22除以7大约等于π。22/7可是最流行的代表π的分数。”
来自Yupoo的这张π演算图有点意思:
π的演算图示

六、Google地图/地球也玩PS?
Google地图/地球中,丹麦首都哥本哈根以西35公里的海面上有9架飞机,看上去一模一样,被认为是使用Photoshop里的”仿制图章工具”做出来的,而且做的人功力或时间不足。你觉得是吗?

Via: GSeeker:Google Maps/Earth上的飞机“影分身”

如果真是这样,那上周看的精彩Google地球视频,有些奇怪的图形,会不会也是用什么东西做出来的?
另:哥本哈根东临大海,那地方是在离哥本哈根很远的内海。

update (2007-3-31): GSeeker:  Google Earth图像升级(07.03.30) 已删除PS版飞机

七、如果挖穿地心,会挖到哪儿?

试试这里,用Google Maps做的:If you dig straight down, where will you end up?
Via: GSeeker:DigHole:如果一直挖,地球另一端是哪里?

不单是好玩噢,DigHole是这么说的:
This webpage is useful for teaching, geography, maps, entertainment, education, school, K12, anitpode, anitpodal, the other side of the world, etc.

用Google学术搜索查作者相关度·e划通

    2月初,在“烂泥巴的园子”里看到国家科学图书馆推出e划通业务,就跑到该馆网站去看,发现提供e划通下载(5.57MB)。安装完成,正好有篇Word文章打开着,随手选中“XXXX”后,“e划通”窗口弹出,显示“找文章、期刊、图书、网络、更多”及“问图书馆员”。依次试查,试到“网络”,原来查的是Google学术搜索。
    很久没用Google学术搜索了,发现左栏“所有结果”下是一串人名,令自己吃惊的是,竟然第一个就是本人。点本人姓名,结果就更令人吃惊了……
    看检索出的信息,基本来自维普。左栏是Google对维普提供数据的一种挖掘,如果去维普网站查,就看不到这样的提示。
    试总结用Google学术搜索查作者相关度的方法:

1、合著者名录
不加其他检索词,直接检索“author:AAA”,左栏依合作度,列出与AAA合著者姓名
2、合著作品
不加其他检索词,直接检索“author:AAA author:BBB”,可以检索出所有AAA与BBB合著作品;更多人则以此类推。
3、相互关系
检索“author:AAA "BBB"”,可检索出AAA与BBB合著,以及AAA在作品中引用BBB的情况(正文提及/引文);查BBB与AAA关系以此类推。特别注意未做作者的人名应当用引号括起,以免产生误检。

    今天为写此文,在浏览器中再用e划通,发现选词后竟然没有弹出e划通的窗口!将“阻止弹出窗口”取消后仍不起作用。当时用的是Firefox,狐疑之下改用IE试,倒是可用。“e划通”不能用于火狐吗?

参见:
烂泥巴的园子: Five Weeks to a Social Library (Feb 8, 2007)
CNKI的引文检索功能(兼及维普)(2005-09-14)
通过Google学术搜索下载图书馆订购电子资源 (2006-02-04)
国家科学图书馆的网络营销 (2006-05-03)

百度与Google的“相关搜索”

    正月初四晚,年过得差不多了,无所事事在Google中查自己的博客。结果发现页尾提示的“相关搜索”居然是“编目精灵+真名”,不免引来好奇心,想看看百度结果会是如何。 结果两相比较如下:

·“百度一下,找到相关网页约38,200篇,用时0.001秒”
·Google“网页?约有14,000项符合”编目精灵“的查询结果…(搜索用时 0.19 秒)”

百度与Google检索“编目精灵”结果对照

    除了结果显示方式两者不同外,还有两个发现:

1、排序结果:前两项百度比Google合理,新家在前、老家在后。第三项以后则见仁见智,不好说孰优孰劣了(Google的第三项是“Web20与信息服务>> 视频5:编目精灵”)。

2、相关搜索:Google基于对用户搜索历史数据的分析,有点推荐“检索此词的用户还检索的其他词”的意思,揭示出一些隐含信息,比如让我知道了原来有一些人在搜索编目精灵的真名。而百度只是对当前搜索关键词的简单匹配,推荐意义不是很大。

    后来又去查了其他几个搜索引擎,都无法与Google和百度相比。其中最好的雅虎,“共返回约 59,287 项 [用时 0.054 秒]”。搜索结果页尾也有相关搜索(相当于百度的相关搜索),页首另有热门搜索(类似Google的相关搜索),只是没有出现像Google那样令人感兴趣的信息。雅虎的搜索结果数量在几个搜索引擎中最多(自然无效结果也最多),排序比Google还差,老家第一,新家排到了第四。

    结论是:中文搜索,百度确实不错。
    但除了上述第2条,百度还有需要向Google学习的地方,很多人都指出过——那就是广告。比如在百度搜索“编目”,第一个结果是某书屋,只在结尾处有两个小字“推广”,实在不容易让用户注意到那是一个广告(此结果只有一个广告,用户还算比较幸运)。在Google搜索“编目”,该书屋的广告出现在搜索结果的右栏,自然是钱出得比较少。但即使他出了更多的钱,Google也会将广告用浅蓝色底明显标记,并在右首标明为赞助商链接,以免用户误点、广告主花冤枉钱。

另见:搜索“编目”,今天我第一 (2005-06-28)