维基网站JotSpot怎会被Google收购?

    得知维基网站JotSpot居然在前几天被Google收购了。在我看来,JotSpot至少在三个月前是家很不可靠网站,Google为何收购它?当然对JotSpot,被Google收购,应该可以脱胎换骨,让用户有些安全感。

    我在2005年12月28日注册了catwizard.jot.com,忘了当初看了谁的介绍,在众多维基(wiki)网站中确定用JotSpot试手。其实注册后就摆那儿了,一直没用过。直到七月初,新部门启动,我无意中发现注册过这个网站,就想着身体力行,把这个维基做成部门各种信息、规章制度的档案。一切刚开始,内容不多,花了些时间就都整进去了。内容都是直接输进去的,连个备份也没做,想想真是太大意。
    墨菲法则应验。才十多天时间,7月17日访问该页,居然说我要访问的空间不存在(Webspace Not Found)。忙去看主页,原来网站竟然不吱一声就改版了。发电邮去问,没见回复,网页显示内容已经变成了“Webspace inactivity alert”,说根据他们的记录,我已经超过30天没有访问了,所以进入冬眠模式(a hibernation mode),要发电邮去,48小时内复活。7月22日名为Annette的客服来邮,问我是要访问旧帐号,还是要同名的新帐号。我告诉她,我先要备份旧帐号中的内容,是不是要同名新帐号再考虑。就此没有下文,我也心灰意冷,权当又一次“一无所有”。
    三个月过去,10月26日忽然收到邮件,说是问题解决了,让我去激活——大概是已经确定被Google收购了吧。我忘了登录口令,让重发口令也没收到邮件。
    今天先看到梁董转载Yahoo!奇摩新闻“Google併JotSpot 維基技術展野心”。登录邮箱,发现11月1日JotSpot发来的电邮“JotSpot is now part of Google”。当初改版,怎么不记得来个邮件先通知一下,也好让我备份!再去登录界面,点击“忘记口令”,瞬间登录链接就发到邮箱中了——就那么几天,是不是Part of Google,就有这么大的差别?
    口令是重新设置了,但里面的内容还是全没有了。这让我心有余悸,不知道是不是要在这里重新开始我的维基计划。成为Google的一员,在内容方面的担心或许是不必了,但同时会有另一个担心——就像Blogspot,刚开放了没几天,那服务器说找不到就找不到了,一点没商量的余地。

参见:

建立维基前需要考虑的问题

更新:

几天不上网,就跟不上趟了:刚发现关于此项收购的评论已满天飞了。
目前JotSpot暂停新用户注册,要了解其功能,下面文章有详细介绍,还有不少截图:
G速客:Google Office第二步:Google收购JotSpot

落花流水·红绿灯&亿唐

    红绿灯(RedLightGreen)是研究图书馆集团(RLG)的面向公众的网上联合目录。出现于2003年,现在可以在互联网档案中看到它最早的存档日期是2003年10月2日。它是第一个实现FRBR集中同一作品功能的联合目录/OPAC,其检索结果界面也是很多新一代OPAC的模仿对象。现在访问它的主页,会告诉你它要关门了:

RedLightGreen Service to End
As of November 1st, RedLightGreen will no longer be available as a service, and users are encouraged to explore WorldCat.org for locating the best bibliographic resources.

5月3日,RLG宣布意图与OCLC合并;
6月9日,RLG成员批准合并
7月1日,RLG正式并入OCLC;
8月初,OCLC在网上部分版联合目录Open WorldCat基础上,推出完全版网上联合目录WorldCat.org;
8月28日,RLG经由博客渠道,发布其旗下网上联合目录RedLightGreen将于11月1日停止服务消息。

    最早公布的消息,来自Merrilee Proffitt (Program Officer, RLG Programs, OCLC Programs and Research):
RICH :: Ref Info & Com Hub :: RedLightGreen to cease as of Novmeber 1, 2006 

    最早最伤感的回应,来自曾经跟RLG合作,欲与OCLC一争高下的TALIS:
panlibus: Red light for RedLightGreen 

    另几位博客为RedLightGreen唱的挽歌:

The FRBR Blog: RedLightGreen closing 

Catalogablog: RIP RedLightGreen

    曾经在 RedLightGreen 注册过,10月4日收到 RedLightGreen Team 的正式电子邮件,称 RedLightGreen 服务将于11月5日终止,如有保存的书目信息,应在11月4日前处理(电邮、打印、下载)。

关于RedLightGreen,请参见:红绿灯RedLightGreen

 
    12月1日,我的第一个免费邮箱——亿唐邮箱也将停止服务。亿唐始于1999年,前几年我还曾在超市销售的休闲背包上看到它的标识,当年其影响可见一斑。现在亿唐只保留了它的一个服务。
    我应该在很早就注册了亿唐邮箱,后来用它注册了很多网上服务,所以一直用到今天。早在9月1日就收到了停止服务公告,说明2006/12/1邮箱登录停止,2007/2/1前可仍通过设置的自动转发收取邮件。公告中附有相关的操作说明及链接、客服信息及FAQ,应该说它的“后事”安排得相当好。不象toPim,不吱一声就关了门,让人徒唤奈何。
    在免费邮箱越来越多、容量越来越大的今天,亿唐邮箱的关闭不会对多少人有太多影响。就好象RedLightGreen被WorldCat.org取代,太自然了。

    流水落花春去也,换了人间!

第二届OCLC软件竞赛结果

    9月28日,OCLC宣布第二届软件竞赛结果,来自佐治亚州理工学院的Ross Singer获奖,他的项目是一个名为Umlaut的OpenURL链接解析器。竞赛结果公告称,Umlaut将读者引向全文的能力令评委印象深刻,并且比赛所要求的使用OCLC服务也做得相当好。

    Umlaut的工作方式是:

    当用户开始一个查询,Umlaut取其IP地址,查询OCLC解析器登录处(OCLC Resolver Registry)。如果该IP还有其它链接解析器,就把那些服务一并加入用户collection。
    然后基于文档集中该用户的collection,包括增加相关的图书馆目录与链接解析器,目标是使所有可获取的信息能让用户触手可及,包括可访问的的公共图书馆、其它学校或其他图书馆。

分析书目信息(citation)
    如果查找项有标准的标识符(identifier)(目前基于用户群的需求用dois和pmids,但也偶用OCLC号、bibcodes和handles),就从来源中查找该标识(id authority)(crossref, pubmed等),并抓取书目中所有元数据。
    然后把元数据递交请求给SFX(也支持其它链接解析器)、本馆目录(输出至Zebra数据库)及本州联合目录(均由SRU检索)。
    如果有ISBN,使用xISBN获取所有版本并检索。
    在会议录的场合,Umlaut会做一系列的检索(因为取得的书目元数据常常质量不一,不总是明确表示是会议录,因此用一个关键词表[papers, transactions, spie, ieee 等]以确定是否会议录),然后用大致的书目OpenURL上下文集,在本馆OPAC中查找会议及卷册。

检索相关数据库
    如果查找项有ISSN或ISBN,会检索WorldCat.org,如果命中,会显示一个查看链接。
    然后检索亚马逊(如果有ISBN)、Google和雅虎(使用其API)。
    从亚马逊获取所有元数据(介绍、类似图书等)。
    对Google和雅虎,它会在结果中检查“相关网站”白名单(ROAR, arXiv, Citeseer等)或者黑名单(Amazon.*及其它联机书商),然后检查每个链接,看是否出现在我们的代理服务器(EZProxy)。
    一些URL有特别的handlers (arXiv, Citeseer, Citebase, CiteUlike等),Umlaut作不同处理。arXiv, Citeseer和Citebase进入“全文库”(Fulltext holdings bin),CiteUlike作为介绍、标签与目次。其它入“最接近的Web结果”(Closest Web Results)。

显示
    呈现页面时,一个AJAX call返回服务器,服务器处理一系列背后需求。
    如果在Google/雅虎结果中识别出OAI provider,Umlaut会让记录的OAI需求可见(当前仅对Citebase和Citeseer起作用,并根据元数据的质量合并结果)。
    它也获取全文链接(如果有的话),查询Connotea、雅虎的MyWeb及Unalog,看是否有人收藏这些链接。如果有链接,获取标签及共享这些标签的所有记录。它也对CiteULike作同样处理,但把它当作OAI提供者。
    它存储从各处收集来的主题(来自Pubmed的MeSH、SFX主题、来自OPAC的LCSH、标签、亚马逊),作为指示物帮助告知即将开通的推荐服务(当在今秋)。
    Umlaut也能用COinS,有unAPI界面(给出ContextObject及它在JSON或XML中发现的任何数据)。

看演示:
文章:http://umlaut.library.gatech.edu/go/523
图书:http://umlaut.library.gatech.edu/go/522
会议录:http://umlaut.library.gatech.edu/go/524
使用搜索引擎寻找预印本:http://umlaut.library.gatech.edu/go/521
   http://umlaut.library.gatech.edu/go/525

    结果显示页面多数情况有四部分,左上部是书目信息,左中部是全文链接(含电子版、印刷版)、左下部是“最接近的Web结果”,一般也是全文;右栏则是介绍、Web检索结果等相关结果。

    看完获奖作品介绍,感觉Umlaut用了太多的新潮技术与Web服务。很多都是只知其名,不知其义的,居然都集成在一个项目中了!(还有一些术语不知如何翻译)

    从介绍看,佐治亚州理工学院应该购买了SFX,但Ross还是做了大量的工作。这也说明现在买来链接解析器后,确实还要做很多后期开发。要不然,不管有没有合适的检索结果,一骨脑的列出链接。如果链接点击后没有合意的结果,几次一用,用户就没了兴趣,最终链接解析器就只能是摆设了。

相关链接:
第二届OCLC软件竞赛 /posts/20060707210241.html

竞赛结果公告:Ross Singer of Georgia Tech wins Second OCLC Research Software Contest
http://www.oclc.org/research/announcements/2006-09-28.htm

获奖作品介绍:About Ross Singer’s Umlaut
http://www.oclc.org/research/announcements/features/umlaut-about.htm

佐治亚州理工学院图书馆网站的Umlaut主页:
http://umlaut.library.gatech.edu/umlaut/

Umlaut的博客,追踪其进展:
http://umlaut.library.gatech.edu/blog/

同期举行的Talis软件竞赛:TALIS软件竞赛结果 & 竞赛在继续
/posts/20060913201756.html