搜索“编目”,今天我第一

    今天头晕晕的,不想写blog。从RSS阅读器中看到A9变脸,跑去看看。职业习惯,随手输入“编目”二字。同时选择了Web与Books,想着查查看有没有编目方面的书――居然想亚马逊上有中文编目书卖?
    Web结果第三条就是“编目精灵”(catwizard.blogchina.com),真是出乎我的意料。
    于是把几个常用搜索引擎都拿来搜一搜,输入“编目”,Google、百度、雅虎中国MSN中国(3721)竟然都是第一,更出乎意料。
    常收到垃圾邮件,说只需花N元就可以使Google排名进入前十位。不知道所用的办法是不是象我这样,不断地发些东西,经常使用“编目”这个关键词。

   搜索引擎的排名是动态的,如同网上的内容,不知道何时就没了踪影。
    某天想起曾在网上见到过一个Flash,想在blog中引用。那时还没用网摘,网址没保留。通过Google搜索,花很大功夫找到,却已不可访问。通过网页快照信息,用QQ联系上作者,不料作者说那个Flash他自己也没保留。今天想用网页快照将此Flash链接于此,却发现网页快照也已失效。
    那个Flash是“103被7整除”。半生前由L君告知“103被7整除”的秘密,晃悟世界原来有不同的规则,而人生也常在“103被7整除”中度过。

 

雅虎及其上下文搜索、订阅搜索

    一直以来,关注Google而极少关注雅虎。虽然也有雅虎邮箱,还承游园邀请建立了Yahoo! 360,但如雅虎搜索一样,平常都没怎么用。

    数月前,Search Engine Watch将其年度奖中最重要的“杰出搜索服务奖”授予了雅虎,而此前四届此奖均由Google获得。当时看到,也没有什么感觉,因为对雅虎所知甚少,也没花时间去看评语

    前两天看到一些与雅虎有关的消息,花些时间看看了看雅虎。

    一条就是昨天日志中说的索引Thomson Gale公司的付费数据库。
    美联社的那个报道中还提到,与Google引起争议的扫描图书馆藏书计划相对应,雅虎与美国国会图书馆合作扫描那些以前无法访问的文献。不过我在网上没找到相关报道。

    第二条不记得是什么消息了,但让我找到了雅虎的Web Search (Y!Q),也就是上下文检索(Contextual Search)。Beta版,不支持汉语。
    作为例句的“I need to know the gas mileage for my audi a8 2004 model”找到的结果比较准确。有点搞笑的是,搜索结果居然首先出现提示信息“Contextual Search disabled because your query is longer than the supported length.”不过这似乎并没有影响其查找结果,靠后的几个关键词都出现在了检索结果中,而“I need to know”这样的提问语则被忽略。
    但我如法炮制的搜索语“I need to know something about Shanghai”,检索结果中首条就在标题中出现提问语“need to know”,当然文中有“Shanghai”。分析一下,应该是例句中有较多关键词,如Audi、a8、2004、model、gas、mileage。而我的搜索语中仅Shanghai一个关键词而已,如不加入其他短语,则等同于仅输入一个词,故而雅虎将所有词均视为关键词搜索。
    总之遇多关键词检索是可以一试的啦。只是也有疑问,如果我想知道关于“奥迪a8 2004型汽车每公里油耗”,为什么我不直接输入“Audi a8 2004 model gas mileage”,而要输入前面那么多废话?或许汉语与英语句法结构不同,外国人要找同样的信息并非如上面顺序输入,而是如例句那般以gas mileage audi a8 2004 model顺序?而有了上下文,雅虎就可以了解最重要的信息是“Audi A8”,而非“gas mileage”?

    第三条是关于“雅虎订阅搜索”Yahoo Search Subscriptions的,昨天日志中曾提及。Search Engine Watch上的这篇“Yahoo Search Subscriptions Brings Premium Content Into Web Search”有全面深入的报道与评述,值得一看。

 

趋势:通过搜索引擎查找收费电子资源

    那些需要订购才能阅读的网上数据库,由于需要登录访问,所以无法被一般搜索引擎索引,而大部分人也无从知晓其收录内容。而现在,收费数据库“不可见”的情况已经渐渐地改变了。
    美联社6月16日消息,“图书馆供应商向搜索引擎提供资料”(Library supplier to provide material to search engines),说有约5000家美国公共、学术与军事图书馆参与Thomson Gale公司的试验项目,让Google和Yahoo扫描Thomson Gale的收费资源。这些资源日后会在搜索结果中一同出现,但只有参与计划图书馆的读者才能读全文。
    据说为避免搜索结果中订购内容淹没于免费网上资源,Thomson Gale公司为此开设了专门网站AccessMyLibrary,单独提供检索。
    上“雅虎订阅搜索”Yahoo Search Subscriptions去看,其实现在已有了IEEE publications、New England Journal of Medicine和Wall Street Journal等七个数据库。虽然Thomson Gale还要过些日子才会加入,但显然在雅虎,通过订阅搜索,结果是不会淹没于免费网上资源之中的。

    一方面让大型搜索引擎索引,一方面自己提供免费检索,全文数据库商的行动让我想起互联网流行前后联机检索公司的变化。
    在互联网流行前,数据库商本身不提供检索服务,而是将数据库交给联机检索公司如DIALOG(http://www.dialog.com/)之类,通过网络专线提供服务。当时主要是文摘索引,用户花费不菲,得到的结果只是文摘,还要花很多精力去找原文。
    互联网兴起后,出现了以免费索引吸引用户,通过提供原文获取利润的服务,如期刊目次服务UnCover。这时联机检索公司也想起提供原文,其实是很好的增值服务。
    再后来,全文期刊差不多已经取代文摘索引了,以提供期刊原文为生的UnCover式微,卖给了Ingenta。而互联网的开放,让很多数据库商可以自己提供服务,或直接将数据库卖给图书馆而不必借助于联机检索公司。于是,DIALOG需要通过Open Access提供免费检索,吸引更多的人气。至于接下别人愿不愿意付费看原文,那就是另一回事了。

    现在,被免费搜索引擎宠坏了的普通人,只需要结果,并不去考证结果的准确性;有免费资源、简单检索,根本不会费心去找订购资源。于是,拥有大量全文资源的数据库供应商,面对Google、Yahoo,就象当初面对UnCover之类的联机检索公司。
    这些需订阅使用的数据库,主要依靠图书馆订户,而图书馆在经费紧张的情况下,是否继续订购,无疑取决于数据库的利用率。
    只有让人知晓,才能更好生存。G5(很怪的简称)与Google合作索引其馆藏图书,也是此意。
    免费检索,大势所趋。

    有点奇怪的是维普,原来我很喜欢它。虽然没有全文检索,但收录期刊多,且在几个期刊全文库中,就数维普最为开放。www.tydata.com可以随意检索,颇合互联网免费检索的潮流。但前些日子发现,网址似乎换成了www.cqvip.com,无法随意访问了。希望不是我的网络连接有问题。