第二届OCLC软件竞赛结果

    9月28日,OCLC宣布第二届软件竞赛结果,来自佐治亚州理工学院的Ross Singer获奖,他的项目是一个名为Umlaut的OpenURL链接解析器。竞赛结果公告称,Umlaut将读者引向全文的能力令评委印象深刻,并且比赛所要求的使用OCLC服务也做得相当好。

    Umlaut的工作方式是:

    当用户开始一个查询,Umlaut取其IP地址,查询OCLC解析器登录处(OCLC Resolver Registry)。如果该IP还有其它链接解析器,就把那些服务一并加入用户collection。
    然后基于文档集中该用户的collection,包括增加相关的图书馆目录与链接解析器,目标是使所有可获取的信息能让用户触手可及,包括可访问的的公共图书馆、其它学校或其他图书馆。

分析书目信息(citation)
    如果查找项有标准的标识符(identifier)(目前基于用户群的需求用dois和pmids,但也偶用OCLC号、bibcodes和handles),就从来源中查找该标识(id authority)(crossref, pubmed等),并抓取书目中所有元数据。
    然后把元数据递交请求给SFX(也支持其它链接解析器)、本馆目录(输出至Zebra数据库)及本州联合目录(均由SRU检索)。
    如果有ISBN,使用xISBN获取所有版本并检索。
    在会议录的场合,Umlaut会做一系列的检索(因为取得的书目元数据常常质量不一,不总是明确表示是会议录,因此用一个关键词表[papers, transactions, spie, ieee 等]以确定是否会议录),然后用大致的书目OpenURL上下文集,在本馆OPAC中查找会议及卷册。

检索相关数据库
    如果查找项有ISSN或ISBN,会检索WorldCat.org,如果命中,会显示一个查看链接。
    然后检索亚马逊(如果有ISBN)、Google和雅虎(使用其API)。
    从亚马逊获取所有元数据(介绍、类似图书等)。
    对Google和雅虎,它会在结果中检查“相关网站”白名单(ROAR, arXiv, Citeseer等)或者黑名单(Amazon.*及其它联机书商),然后检查每个链接,看是否出现在我们的代理服务器(EZProxy)。
    一些URL有特别的handlers (arXiv, Citeseer, Citebase, CiteUlike等),Umlaut作不同处理。arXiv, Citeseer和Citebase进入“全文库”(Fulltext holdings bin),CiteUlike作为介绍、标签与目次。其它入“最接近的Web结果”(Closest Web Results)。

显示
    呈现页面时,一个AJAX call返回服务器,服务器处理一系列背后需求。
    如果在Google/雅虎结果中识别出OAI provider,Umlaut会让记录的OAI需求可见(当前仅对Citebase和Citeseer起作用,并根据元数据的质量合并结果)。
    它也获取全文链接(如果有的话),查询Connotea、雅虎的MyWeb及Unalog,看是否有人收藏这些链接。如果有链接,获取标签及共享这些标签的所有记录。它也对CiteULike作同样处理,但把它当作OAI提供者。
    它存储从各处收集来的主题(来自Pubmed的MeSH、SFX主题、来自OPAC的LCSH、标签、亚马逊),作为指示物帮助告知即将开通的推荐服务(当在今秋)。
    Umlaut也能用COinS,有unAPI界面(给出ContextObject及它在JSON或XML中发现的任何数据)。

看演示:
文章:http://umlaut.library.gatech.edu/go/523
图书:http://umlaut.library.gatech.edu/go/522
会议录:http://umlaut.library.gatech.edu/go/524
使用搜索引擎寻找预印本:http://umlaut.library.gatech.edu/go/521
   http://umlaut.library.gatech.edu/go/525

    结果显示页面多数情况有四部分,左上部是书目信息,左中部是全文链接(含电子版、印刷版)、左下部是“最接近的Web结果”,一般也是全文;右栏则是介绍、Web检索结果等相关结果。

    看完获奖作品介绍,感觉Umlaut用了太多的新潮技术与Web服务。很多都是只知其名,不知其义的,居然都集成在一个项目中了!(还有一些术语不知如何翻译)

    从介绍看,佐治亚州理工学院应该购买了SFX,但Ross还是做了大量的工作。这也说明现在买来链接解析器后,确实还要做很多后期开发。要不然,不管有没有合适的检索结果,一骨脑的列出链接。如果链接点击后没有合意的结果,几次一用,用户就没了兴趣,最终链接解析器就只能是摆设了。

相关链接:
第二届OCLC软件竞赛 /posts/2006/0707/855

竞赛结果公告:Ross Singer of Georgia Tech wins Second OCLC Research Software Contest
http://www.oclc.org/research/announcements/2006-09-28.htm

获奖作品介绍:About Ross Singer’s Umlaut
http://www.oclc.org/research/announcements/features/umlaut-about.htm

佐治亚州理工学院图书馆网站的Umlaut主页:
http://umlaut.library.gatech.edu/umlaut/

Umlaut的博客,追踪其进展:
http://umlaut.library.gatech.edu/blog/

同期举行的Talis软件竞赛:TALIS软件竞赛结果 & 竞赛在继续
/posts/2006/0913/860

图书馆2.0技术

    Keven在Google数字图书馆讨论组diglib转发曾蕾提供的信息,俄亥俄州立大学图书馆为相关培训课程在网上做的“图书馆2.0技术”(Library 2.0 Technologies)自测。说是自测,其实是一个网上调查,最后并不告知你得了多少分,或者是否可称得上及格。
    你可以借此了解主办者眼中的“图书馆2.0技术”都包含些什么,自己又了解多少。调查内容如下:

1  Please complete the following self-assessment rating your level of knowledge of each of the topics as related to its use in the library context. 
    
2D/3D visual information(二维三维可视信息)
Blogging(博客)
Flickr(http://www.flickr.com
Folksonomies(通俗分类)
Gaming(游戏)
Interactive catalogs(交互式目录)
Mashups
Media sharing(媒体共享)
Podcasting(播客)
RSS
SMS/text messaging(短信服务)
Social bookmarking(网摘)
Social computing(MySpace,Facebook, etc.)(社会化计算)
Social tagging(社会标签)
Virtual reality spaces(虚拟现实空间)
Web services
Web 2.0
Wikis(维基)
YouTube(http://www.youtube.com

2  What additional topics would you like to see covered in a training session? 

    填了调查表。所列的技术或服务或网站,差不多都听说过甚或用过,但若论在图书馆的应用,了解多少就很难说了。

TALIS软件竞赛结果 & 竞赛在继续

    前两个月曾介绍过英国TALIS公司主办的“Mashing Up The Library competition”,Keven在提交截止期后还对竞赛作品作了分析。现在结果揭晓,Leon已在第一时间做了报道

    与稍后举行的“OCLC第二届软件竞赛”相比,TALIS竞赛很重要的区别就是不要求使用自己的服务,这就对开发者少了很多限制。因而也会有另类的网络虚拟社区中的图书馆――联盟图书馆系统(Alliance Library System)的第二次生命图书馆(Second Life Library 2.0)得到二等奖。
    以前也曾介绍过这个虚拟图书馆我的Google Page上的图片就是它的一个场景。它的博客Second Life Library 2.0上有很多信息,看上去活动内容很丰富,亚马逊、OCLC等曾都在那里推广自己的服务,弄得像真的一样。自己年岁渐长、精力有限,对电脑游戏兴趣不再,而年轻人则大可去探索一番。在虚拟社区推广图书馆服务,或许是图书馆在网络时代延续自己存在的一个不错的选择?
    对此次获奖,它的博客仅转发了TALIS网站对此事的报道,竟然未再另置一词。

    一等奖给了Ann Arbor District Library (AADL) 的 John Blyberg的go-go-google-gadget,他是最后一个提交竞赛作品的,在TALIS上发布时已是截止期后一天了(注明“entry received within deadline via email”)。
    AADL博客界面的图书馆网站、用户参与形成的本地图片库、OPAC检索RSS推送、OPAC检索结果显示智能关联,等等,都是图书馆2.0的绝佳实例。同时,John提出图书馆自动化系统客户权力(ILS Customer Bill-of-Rights),引发博客界讨论之外,还与作为图书馆自动化系统供应商的TALIS不打不相识,更使John成为图书馆2.0中不可忽视的人物。John理论与实践结合,感觉上他原该是评委。或许,这个一等奖就是为他准备的,如果做评委就不能参赛了。
    John得奖后,除发表感言外,还对本次竞赛的其它作品作了一番评价,可以与前述Keven的评介对照着看。

    因为二个奖项都给了老美,所以标示的英镑奖金就乘以2,折算成美元发放了。
    在美国图书馆协会的技术博客(ALA TechSource),Teresa Koltzenburg对两个获奖作品作了比较详细的介绍

    比赛结束,TALIS随即更新了竞赛网页,将竞赛变成一项持续的活动,随时接受新的参赛作品。据称将定期评比,对突出的创新实例还将另有奖励。不过没有明示奖金几何。

    参赛方法:
1、在自己博客上发布,加上Technorati标签“MUTL06”(http://technorati.com/tag/MUTL06
2、给TALIS发电邮告知
3、登录TALIS的“竞赛作品论坛”(Competition entries)发布
    刚看一下,居然结果宣布的当天已有一个新作品提交了(Displaying Library Related Feeds on Netvibes and Google)。

    另外,如果你有好主意,但没有能力实施,则可以把主意提交到TALIS的“竞赛意念论坛”(Competition ideas),看有没有人将之付诸现实,日后可共享成果。

    看来TALIS要借全世界人的脑袋来用了。不是2.0吗?


参见:
TALIS与图书馆2.0(http://catwizard.blogchina.com/5269930.html
从软件竞赛看企业的“图书馆2.0”策略(http://catwizard.blogchina.com/5393518.html

Keven&aposs Blog 数图研究:Talis图书馆应用融合竞赛作品浅析(http://my.donews.com/keven/2006/08/20/

奇正童话:TALIS的图书馆混搭(mashup)应用大奖开出来了(http://my.donews.com/leonz/2006/09/12/

blyberg.net:Mucho Mashup(http://www.blyberg.net/2006/09/11/mucho-mashup/

网络游戏中的图书馆2.0(http://catwizard.blogchina.com/4904742.html

ALA TechSource:Mashup Magnificents(http://www.techsource.ala.org/blog/2006/09/mashup-magnificents.html