社会编目 Social Cataloging

    给图书编目早已不是图书馆的独门绝技,外包公司们早就在做了。近年又出现了个人书目网站,于是每个藏书者或爱书者都成了编目员——和现在的编目员一样,他们做的大部分是套录工作,由网站提供相应工具,只需提供少量信息,就可以从外部获取完整的书目信息,做成自己的收藏目录。
    这些个人书目网站被称为社会编目网站(social cataloging sites),据Tim Spalding称社会编目处于爆发状态,目前已有40个这样的网站。维基百科的 Social cataloging applications 中列出了20多个(其中大部分只是存目,尚未撰写内容)。
    Tim 是 LibraryThing 的所有者,作为社会编目网站的开发者,Tim 在 Ning 上建了社会编目网站开发者的网络——“社会编目员”(SocialCatalogers) ,用于相互间的交流。按一般的理解,这些同一类型网站无疑是竞争对手,但 Tim 似乎更多地把它们看作一个产业,尽管还很弱小(a dwarf industry),但却有合作的可能性。

    对于社会编目网站,我一直比较关注LibraryThing,很欣赏 Tim 不断挖掘书目信息,绞尽脑汁收集相关信息集成到网站中的做法;偶而也用豆瓣/douban。但对这些网站多是片断的直感,没有整体性的思考。看到librarytwopointzero 对三个社会编目网站 Librarything, Shelfari 及 Gurulib,就特色、外观/易用、数据控制与所有权(导入导出)及社区与社会网络四个方面进行比较,很有启发。以下是结果:

        Librarything    Shelfari    Gurulib
特色         7            5           8
外观/易用    7            8           4
数据控制     9            5           7
社区         9            6           4
合计        32           24          23 
    
 

参见:
Thing-ology (LibraryThing’s ideas blog) (February 27, 2007)
SocialCatalogers: For people who make social cataloging applications

librarytwopointzero (October 21, 2006)
Librarything, Shelfari, and Gurulib: Social Cataloging Sites Compared

关于 Ning (http://www.ning.com/),参见:
译言-技术与创业:Ning的进化 (2007/2/27)

关于LibraryThing,参见相关博文

用Google学术搜索查作者相关度·e划通

    2月初,在“烂泥巴的园子”里看到国家科学图书馆推出e划通业务,就跑到该馆网站去看,发现提供e划通下载(5.57MB)。安装完成,正好有篇Word文章打开着,随手选中“XXXX”后,“e划通”窗口弹出,显示“找文章、期刊、图书、网络、更多”及“问图书馆员”。依次试查,试到“网络”,原来查的是Google学术搜索。
    很久没用Google学术搜索了,发现左栏“所有结果”下是一串人名,令自己吃惊的是,竟然第一个就是本人。点本人姓名,结果就更令人吃惊了……
    看检索出的信息,基本来自维普。左栏是Google对维普提供数据的一种挖掘,如果去维普网站查,就看不到这样的提示。
    试总结用Google学术搜索查作者相关度的方法:

1、合著者名录
不加其他检索词,直接检索“author:AAA”,左栏依合作度,列出与AAA合著者姓名
2、合著作品
不加其他检索词,直接检索“author:AAA author:BBB”,可以检索出所有AAA与BBB合著作品;更多人则以此类推。
3、相互关系
检索“author:AAA "BBB"”,可检索出AAA与BBB合著,以及AAA在作品中引用BBB的情况(正文提及/引文);查BBB与AAA关系以此类推。特别注意未做作者的人名应当用引号括起,以免产生误检。

    今天为写此文,在浏览器中再用e划通,发现选词后竟然没有弹出e划通的窗口!将“阻止弹出窗口”取消后仍不起作用。当时用的是Firefox,狐疑之下改用IE试,倒是可用。“e划通”不能用于火狐吗?

参见:
烂泥巴的园子: Five Weeks to a Social Library (Feb 8, 2007)
CNKI的引文检索功能(兼及维普)(2005-09-14)
通过Google学术搜索下载图书馆订购电子资源 (2006-02-04)
国家科学图书馆的网络营销 (2006-05-03)

百度与Google的“相关搜索”

    正月初四晚,年过得差不多了,无所事事在Google中查自己的博客。结果发现页尾提示的“相关搜索”居然是“编目精灵+真名”,不免引来好奇心,想看看百度结果会是如何。 结果两相比较如下:

·“百度一下,找到相关网页约38,200篇,用时0.001秒”
·Google“网页?约有14,000项符合”编目精灵“的查询结果…(搜索用时 0.19 秒)”

百度与Google检索“编目精灵”结果对照

    除了结果显示方式两者不同外,还有两个发现:

1、排序结果:前两项百度比Google合理,新家在前、老家在后。第三项以后则见仁见智,不好说孰优孰劣了(Google的第三项是“Web20与信息服务>> 视频5:编目精灵”)。

2、相关搜索:Google基于对用户搜索历史数据的分析,有点推荐“检索此词的用户还检索的其他词”的意思,揭示出一些隐含信息,比如让我知道了原来有一些人在搜索编目精灵的真名。而百度只是对当前搜索关键词的简单匹配,推荐意义不是很大。

    后来又去查了其他几个搜索引擎,都无法与Google和百度相比。其中最好的雅虎,“共返回约 59,287 项 [用时 0.054 秒]”。搜索结果页尾也有相关搜索(相当于百度的相关搜索),页首另有热门搜索(类似Google的相关搜索),只是没有出现像Google那样令人感兴趣的信息。雅虎的搜索结果数量在几个搜索引擎中最多(自然无效结果也最多),排序比Google还差,老家第一,新家排到了第四。

    结论是:中文搜索,百度确实不错。
    但除了上述第2条,百度还有需要向Google学习的地方,很多人都指出过——那就是广告。比如在百度搜索“编目”,第一个结果是某书屋,只在结尾处有两个小字“推广”,实在不容易让用户注意到那是一个广告(此结果只有一个广告,用户还算比较幸运)。在Google搜索“编目”,该书屋的广告出现在搜索结果的右栏,自然是钱出得比较少。但即使他出了更多的钱,Google也会将广告用浅蓝色底明显标记,并在右首标明为赞助商链接,以免用户误点、广告主花冤枉钱。

另见:搜索“编目”,今天我第一 (2005-06-28)