可定制RSS的图林博客搜索引擎LibWorm

    医学图书馆员David Rothman,用医学博客搜索MedWorm.com觉得不错,便向在英国的设计者Frankie Dolan女士建议把同样的方法用于图书馆博客界(biblioblogosphere)。Frankie认为没问题,前提是由David承担日常管理工作。于是David收集RSS Feeds、安排分类、提出一些预制搜索、建议功能与界面,经过三个月的努力,由Frankie完成所有设计,LibWorm公开运行。

    LibWorm目前已有约1400个RSS Feeds。
    最初David咨询了Steven Cohen和Blake Carver,得到了第一批Feeds。那二位是LISFeeds的创建者,LISFeeds现已不复存在,而两年前我们也是从那里开始看国外图林博客的。
    接着David从Amanda Etches-Johnson’s Blogging Libraries Wiki得到了数百个图书馆的博客,并且借鉴了Amanda的分类。
    现在,通过免费注册,用户可以自己把Feeds增加进去。
    当11月25日,当David在自己博客中公开LibWorm时,Feeds数是超过1100,短短数日,就增加了数百。从搜索结果看,就图书馆界而言,比Google博客搜索收录的要广得多。

    在1100多个Feeds时,博客800多,还有图情期刊目次及图书馆人士感兴趣的其他信息源。
    LibWorm作为专业的RSS搜索引擎,特别值得推荐的是它有多种RSS订阅,满足不同角度的需求:

        每一个搜索结果都可以生成一个RSS Feed,可用于跟踪某一感兴趣专题(这个Google的博客搜索也有,后面两个Google就没有了)。如果订的博客有限,如此可扩大信息来源;如果订的博客太多,时常来不及看,则可选择只看几个博客、某些专题。
        分类(http://www.libworm.com/rss/librariancategories.php):把博客分成三十个左右的类,如播客、书评、图情杂志、幽默、公共图书馆、法律图书馆、医学图书馆等
        主题(http://www.libworm.com/rss/librarianqueries.php):David根据图情的领域与一些热点,预制的一些博客内容搜索,如会议、版权、电子书、Library  2.0、Mashups等,据说不是简单的一个关键词。

    注册登录后除了可以增加RSS Feed外,还可以使用LibWorm内置的聚合器。David说注册目的是为了未来设想中的社会性功能。(记得谁说过,Web 2.0的特征之一就是要注册!?)
    试了一下,目前还没有包括中文。

对LibWorm的介绍,参见:
About LibWorm:上面的故事大多来自这里
LibWorm: Search and Current Awareness for Libraryfold:David宣布LibWorm开张Information Wants To Be Free:LibWorm: Searching, syndicating and aggregating the bibliblogosphere:维基女王Meredith的报道最详尽
Tame The Web: Libraries and Technology: Announcing LibWorm: Search the Biblioblogosphere
Stephen’s Lighthouse: LibWorm

另:最近由于有人提议维基百科删除”Library 2.0″词条,又引起”Library 2.0″概念之争。David针对T. Scott的反对意见,写了一大篇评论,颇受关注。Tame The Web、LibraryCrunch写博文点评,The Shifted Librarian在David博文下长篇留言。

图书馆小调:OPAC和图书馆2.0

    好几位博客都报道“哈哈笑馆员”(The Laughing Librarian)发布了一首新歌,讽刺OPAC陈旧落伍:The OPAC Sucks。网站上不但有歌词原文,还有歌曲MP3下载,更有配上黑白电影片断的搞笑YouTube视频

    该歌放在网站的“图书馆小调”BibDitties栏目中,看该栏目下现有分在多个类下的十八首歌,其中有一首竟然是“图书馆2.0”(Library 2.0MP3下载),和前一首歌一样,词曲均为Smith:

I went to the public library’s website.
It was very late; it was hours after midnight.
Around-the-clock online reference, alright.

I added the library as a friend in my spaces,
and my library card gives me access to databases.
The search engine is federated.

I wrote a comment on the library’s blog.
Then I downloaded an ebook from the catalog.
It is a manual to train a dog.

Library two-dot-zero.

    描述的大概算是普及版的图书馆2.0理念吧。

    11月22日,一个苏格兰人在维基百科英文版上提出要删除Library 2.0词条,理由是该词是由blogger生造的,只在blogger中使用,并不著名。从发表评论的情况看,几乎是一边倒的Keep,尽管提出保留者并不都赞同Library 2.0这个概念。看看评论,可以对图书馆2.0有更多的了解。
    我很想在后面加上一个评论,说连歌曲都有了呢,可见是个通用词,没有理由删除。可是,现在维基百科又没法访问了。我用的是代理,维基百科不让我编辑,理由是: 
    This IP address has been blocked because it is believed to be an open proxy or zombie computer. To prevent abuse, editing from these proxies is currently prohibited.

关于删除维基百科Library 2.0词条的讨论,参见:
Wikipedia:Articles for deletion/Library 2.0(有一周讨论时间,11/22-29,可以肯定不会删除的了)[2006/11/28更正:11/22-27]
LibraryCrunch: Delete Library 2.0 from Wikipedia?
panlibus: Should we delete Library 2.0 ?
Library Views 圖書館觀點:將“Library 2.0”條目從 Wikipedia 中刪除? [2006/11/28更新]
panlibus: Library 2.0 gets a reprieve  [结果出来了;2006/11/28更新]
LibraryCrunch: Wikipedia to Library 2.0: You Can Stay [Michael Casey自然是最关心的,因为他就是目前意义上“Library 2.0”的第一使用人;2006/11/30更新]
T. Scott: “Library 2.0” and Wikipedia [看看这位“Library 2.0”概念的坚决反对者如何说吧;2006/11/30更新]

关于The OPAC Sucks,参见:
The Laughing Librarian: New song: “The OPAC Sucks”
Library Stuff: The OPAC Sucks
Librarian.net: The OPAC sucks, the video
betabib: The opac sucks – musikvideo(不知何文,请语言猜测家帮忙,结果是瑞典语)
[2006/11/30更新]更多评论可用歌名在各种Blog Search查到。

“澳大利亚国家图书馆2.0”之Picture Australia

    澳大利亚国家图书馆(NLA)的Judith Pearce在前不久举行的一次会议上发表了题为“网站的用户协作”(User collaboration in websites)的文章,介绍NLA在Web 2.0方面的努力。Lorcan Dempsey经同事介绍看了此文,写博文称之为“澳大利亚国家图书馆2.0”(National Library of Australia 2.0)。
    年初看到NLA用Flickr做“Picture Australia”时,一则遗憾没能赶上作为那篇图书馆2.0文章的强有力实例,二则特别佩服NLA的举措。堂堂国家图书馆,像个小公共图书馆那样,让网友帮着自己建数字图书馆,怎么着也觉得有点儿屈尊。

    从Judith此文可以看到,除了“Picture Australia”,NLA还有“Australia Dancing”,也是一个用户协作的项目。目前NLA正计划第三个这样的项目——“People Australia”。

    Picture Australia始于1998,原名ImageSearch,是一个联邦图片搜索服务,目前有44个参与单位提供的百万以上图片。数据库中以历史资料为主,但2004年的一项调查却发现,43%用户来此寻找当代图像。为增加当代图像的数量,并吸引新的用户,NLA开始了与Flickr合作的试验项目(The flickr Pilot Project)。正式发布日期被刻意安排到1月26日“澳大利亚日”(Australia Day) [在Flickr上该组建立日期更早些,最早的评论日期是1月4日]

    选择Flickr的理由是:
有大批澳大利亚追随者 [用户]
鼓励使用元数据帮助发现 [内容]
有编程界面,便于映射到都柏林核心,向Picture Australia贡献记录 [元数据]

    实现方法:用户上载自己的图像到Flickr,将其加入任何一个Picture Australia组中。图书馆每周收割一次元数据与小图标(thumbnail),加入Picture Australia数据库。看大图像一般链接到Flickr,NLA也选择一些有意义的图片,联系创作者获取高精度图像加入数字档案。
    共有两个组 [括号中是2006/10/10的相关数据],分别是:
PictureAustralia: People, places and events [成员451人,图像10111张]
PictureAustralia: Australia Day [成员113人,图像213张]

    原本Flickr项目是为了当代图像,却意外也带来了值得进一步挖掘的丰富的传统图像领域。由于受费用限制,以往Picture Australia 的政策是限制收录家族史资料,现在有Flickr作跳板,NLA就可以广邀大家上载这类作品。

    同样由于Flickr,Picture Australia 也为更多人所知。近期对贡献者调查数据:39%以前未听说过Picture Australia,64%经由Flickr其及成员听说,69%前去看自己的图像。
    另一项针对非贡献者的调查,看他们是否在Picture Australia中查到了更多当代图像。元数据质量是个大问题,因为贡献者自然不会用标准叙词表,而且常常没有为图像提供有充分描述性的题名,或者提供足够多的标签。管理员会监测图像,与贡献者e-mail联系建议适当的标签,以改善元数据质量。由此还形成了贡献者的社区,在讨论组中自我教育与管理。NLA将引导这些社区的发展,对提供内容、标签给予指导。[Web2.0的味道越来越浓了!]

    随着 Picture Australia 越来越庞大,找到需要的图像也越来越困难。它正寻找Web2.0的服务模式以简化访问,答案是所谓的“killer data”[独特的数据,杀手锏?]——它的传统图像,将传统图像与当代资料并置,坚持由成员单位出于保存目的选择图像,对永久保存部分由编目员继续做某种程度的加标签、加地理代码的方法。[编目员在Web2.0时代饭碗还是有啊!]
    NLA已在寻找通过评级(ranking)、聚类(cluster)、地理编码(geocoding)强化访问的途径。在图像服务中,要达到这一目的,依赖于元数据的质量与一致性。NLA开始考虑叙词表映射改善查全,并支持结果集的聚类,只是在图像没有充分、适当描述的情况下还是无法找到。这时用户增加的标签与评论或许就能揭示出先前未知的信息,比如位置、主题。[互补?]
    Picture Australia 的部分参与单位也在自己网站上提供自己的图像服务。如发电站博物馆(Powerhouse Museum)近来开始实验标签,而NLA则建立了工作组考虑加标注(annotation)的需求,包括标签tags、评论comments、附注notes、评级ratings与评论reviews,以支持评级ranking与聚类clustering,或者有趣、相关图像游览。

[原只想摘译,到后面差不多全译了。关于 Australia Dancing 与 People Australia 部分,看兴趣再写吧]

参见:
User collaboration in websites / Paper presented by Judith Pearce at Framing the Future, ARLIS/ANZ Conference, 21-23 September 2006.
http://www.nla.gov.au/nla/staffpaper/2006/jpearce1.html

Lorcan Dempsey’s weblog: National Library of Australia 2.0 (October 08, 2006)
http://orweblog.oclc.org/archives/001169.html