从获奖看国外流行的开源软件

    这两天,国外图林博客最热闹的新闻,大概就是WPOpac于12月4日获得了梅隆信息协作奖(2006 MATC,Mellon Awards for Technology Collaboration)。Casey Bisson分别在自己的博客Maison Bisson (Woot! Woot!)与WPopac blog(Now It’s Really Official)上报料,接下来就是其他blogger的庆贺了。澳州的librariesinteract.info上的报道“Could this blog be your next OPAC?”比较详细,值得一看。[2006-12-10更新:K.G. Schneider(Free Range Librarian在ALA TechSource上发表“Unsucking the OPAC: One Man’s Noble Efforts”,对Casey Bisson获奖给予很高评价,看看这句:“It is doubly exciting to see library software receive that kind of honor. Does your ILS deserve kudos from Tim Berners-Lee?”]

    由此去了解MATC到底是什么性质的奖。经查,这是著名的安德鲁·梅隆基金会(Andrew W. Mellon Foundation)所属六大核心项目之一信息技术研究(RIT, Research in Information Technology)首次颁发的年度奖项,奖励在高等教育及非赢利活动中协作开发开源软件工具的领先者。从颁奖公告(MATC 2006 Winners Announced)看,MATC奖委员会成员均是现今IT界的头面人物,万维网发明人Timothy Berners-Lee还亲自授奖。
    本次奖金总额65万,在MATC奖委员会提名的200多个项目中,有十项获奖。前三项奖金10万美金,后七项奖金5万美金:

Internet Archive因开源工具Heritrix Web Crawler (http://crawler.archive.org)获奖。Heritrix Web Crawler用于大规模互联网学术内容档案的网页抓取。

华盛顿大学因十数年来致力开发开源电子邮件工具获奖:IMAP邮件服务器(http://www.washington.edu/imap)和PINE邮件客户端(http://www.washington.edu/pine)。

Humboldt州立大学(加州)因支持开发的Moodle课程管理系统(http://moodle.org)获奖。

Rensselaer理工大学因Bedework事件日历服务器(http://www.bedework.org)而获奖。RPI重写了Bedework,使之得到了新的协作与开放社区的支持。

英国的开放大学也因Moodle课程管理系统而获奖,开放大学在Moodle及其社区中投入数千小时的编程工作,成为Moodle社区的领导者。

西班牙Lleida大学因Sakai课程管理系统(http://www.sakaiproject.org)而获奖,将Lleida大学将Sakai用于加泰罗尼亚语,为Sakai的国际化作出了突出贡献。

维吉尼亚理工学院和州立大学也因Sakai课程管理系统而获奖。维州理工为Sakai提供质量保证,并创新地在计算课程中将Moodle和Sakai作为编程项目。

耶鲁大学因开发中心认证服务(CAS, Central Authentication Service)(http://www.ja‐sig.org/products/cas)而获奖。数百大学校园因之提供用户的单点登录认证服务。

Plymouth州立大学因开发WPOPAC联机公共访问目录(http://wpopac.blogs.plymouth.edu)而获奖。WPOPAC把每条书目记录转为一个博客页面,使任何图书馆都能使其OPAC互动,用户可以发布评论。WPOPAC适合于任何规模的图书馆,用户因之能与图书馆及其提供的文献有更深入的交互。

加拿大不列颠哥伦比亚大学因开发公共知识项目(PKP, Public Knowledge Project) (http://pkp.sfu.ca)而获奖。PKP提供多种开源工具,支持开放的学术交流。具有在发展中国家创建虚拟学术与出版物的潜能。

    获奖单位都计划用所获奖金继续这些开源工具的开发,如开放大学打算开发一个离线版Moodle,维州大学打算为Sakai开发一个实验室笔记工具,等等。

    总结一下获奖说明,开源软件的最初开发固然必不可少,但应用与社区的维护,也是重要的方面。
    在RIT主页,还可以看到他们资助的各种开源项目。大名鼎鼎的DSpace和Fedora现由基金的另一核心项目“学术交流”(Scholarly Communications)资助。

虚拟上海:上海城市空间

    印半斋留言,说国图网站上有个中国学网络,问“是否可以从里面得知海外上海研究的情况”。
    国图网站丰富,我的盲点更多。既然听说了,就去一看。从主页的“中国学导航”进去,有“汉学家”和“中国学网络”。在中国学网络,检索到一个关于上海的网站。基本介绍

网址:http://virtualshanghai.ish-lyon.cnrs.fr/Image.php
网站名称:Virtual Shanghai——Shanghai Urban Space in Time
网站中文名称:虚拟上海:上海城市空间
创办人/机构:Christian Henriot
网站内容简介:该项目是始于2000年的合作项目,主要基于上海历史照片展现其发展脉络。由法国东亚研究所(Institut d’Asie Orientale)和美国加州伯克利大学中国研究中心(the Center for Chinese Studies of the University of California, Berkeley)合作,数字化了上海历史照片以及地图,试图追溯上海建成到现在的历史,但其重点侧重在19-20世纪的历史。
栏目设置:文件 图片 地图 参考文献 图片目录 总览 检索
特色资源:上海历史照片、相关研究文章等。包括与上海历史相关的上百张的照片和上千篇的文章。

    访问该网站,编者Christian Henriot(IAO东亚研究所/ Lyon 2 University里昂第二大学?)。2005年由法国国家研究局(Agence Nationale de la Recherche)选定为社科与人文研究项目,资助三年。与国图网站的说明不太一致。
    该项目着重十九世纪中叶至今的上海历史。目前主页显示现有记录14780条,大约是即时数据,统计表最新资料是10月25日的(今天才26日),为14659条。网站仍在建设中,但内容已经很丰富了:
   
    图片11148张,最为丰富;
    标有GIS信息的图片1483张;
    地图270张,最早标明年份的是这张1855年彩色的外国人定居点图(Ground plan of the Foreign Settement at Shanghai – North of the Yang Kang Pang Canal)
Ground plan of the Foreign Settement at Shanghai - North of the Yang Kang Pang Canal,对一下家里的地图,此图所示正是外滩这块地方。
    书目1617条,看到的语种有法、英、日、汉;
    ……

    想上网查“Yang Kang Pang”是否为洋泾浜,发现上图“馆藏精选”中也有此图,名《上海租界图》,说明是“上海开埠后第一份英租界地图”,但版本略有不同。看看吧:上海租界图
    
    查Yang Kang Pang时发现“虚拟上海”还有一个网址:http://www.virtualshanghai.net/

P.S.    今天很有感慨,发现老外好象把什么资料都开放了,而我们总喜欢把什么东西都藏着掖着。既然是自己辛辛苦苦做出来的东西,能够让更多的人用,不好吗?

“澳大利亚国家图书馆2.0”之Picture Australia

    澳大利亚国家图书馆(NLA)的Judith Pearce在前不久举行的一次会议上发表了题为“网站的用户协作”(User collaboration in websites)的文章,介绍NLA在Web 2.0方面的努力。Lorcan Dempsey经同事介绍看了此文,写博文称之为“澳大利亚国家图书馆2.0”(National Library of Australia 2.0)。
    年初看到NLA用Flickr做“Picture Australia”时,一则遗憾没能赶上作为那篇图书馆2.0文章的强有力实例,二则特别佩服NLA的举措。堂堂国家图书馆,像个小公共图书馆那样,让网友帮着自己建数字图书馆,怎么着也觉得有点儿屈尊。

    从Judith此文可以看到,除了“Picture Australia”,NLA还有“Australia Dancing”,也是一个用户协作的项目。目前NLA正计划第三个这样的项目——“People Australia”。

    Picture Australia始于1998,原名ImageSearch,是一个联邦图片搜索服务,目前有44个参与单位提供的百万以上图片。数据库中以历史资料为主,但2004年的一项调查却发现,43%用户来此寻找当代图像。为增加当代图像的数量,并吸引新的用户,NLA开始了与Flickr合作的试验项目(The flickr Pilot Project)。正式发布日期被刻意安排到1月26日“澳大利亚日”(Australia Day) [在Flickr上该组建立日期更早些,最早的评论日期是1月4日]

    选择Flickr的理由是:
有大批澳大利亚追随者 [用户]
鼓励使用元数据帮助发现 [内容]
有编程界面,便于映射到都柏林核心,向Picture Australia贡献记录 [元数据]

    实现方法:用户上载自己的图像到Flickr,将其加入任何一个Picture Australia组中。图书馆每周收割一次元数据与小图标(thumbnail),加入Picture Australia数据库。看大图像一般链接到Flickr,NLA也选择一些有意义的图片,联系创作者获取高精度图像加入数字档案。
    共有两个组 [括号中是2006/10/10的相关数据],分别是:
PictureAustralia: People, places and events [成员451人,图像10111张]
PictureAustralia: Australia Day [成员113人,图像213张]

    原本Flickr项目是为了当代图像,却意外也带来了值得进一步挖掘的丰富的传统图像领域。由于受费用限制,以往Picture Australia 的政策是限制收录家族史资料,现在有Flickr作跳板,NLA就可以广邀大家上载这类作品。

    同样由于Flickr,Picture Australia 也为更多人所知。近期对贡献者调查数据:39%以前未听说过Picture Australia,64%经由Flickr其及成员听说,69%前去看自己的图像。
    另一项针对非贡献者的调查,看他们是否在Picture Australia中查到了更多当代图像。元数据质量是个大问题,因为贡献者自然不会用标准叙词表,而且常常没有为图像提供有充分描述性的题名,或者提供足够多的标签。管理员会监测图像,与贡献者e-mail联系建议适当的标签,以改善元数据质量。由此还形成了贡献者的社区,在讨论组中自我教育与管理。NLA将引导这些社区的发展,对提供内容、标签给予指导。[Web2.0的味道越来越浓了!]

    随着 Picture Australia 越来越庞大,找到需要的图像也越来越困难。它正寻找Web2.0的服务模式以简化访问,答案是所谓的“killer data”[独特的数据,杀手锏?]——它的传统图像,将传统图像与当代资料并置,坚持由成员单位出于保存目的选择图像,对永久保存部分由编目员继续做某种程度的加标签、加地理代码的方法。[编目员在Web2.0时代饭碗还是有啊!]
    NLA已在寻找通过评级(ranking)、聚类(cluster)、地理编码(geocoding)强化访问的途径。在图像服务中,要达到这一目的,依赖于元数据的质量与一致性。NLA开始考虑叙词表映射改善查全,并支持结果集的聚类,只是在图像没有充分、适当描述的情况下还是无法找到。这时用户增加的标签与评论或许就能揭示出先前未知的信息,比如位置、主题。[互补?]
    Picture Australia 的部分参与单位也在自己网站上提供自己的图像服务。如发电站博物馆(Powerhouse Museum)近来开始实验标签,而NLA则建立了工作组考虑加标注(annotation)的需求,包括标签tags、评论comments、附注notes、评级ratings与评论reviews,以支持评级ranking与聚类clustering,或者有趣、相关图像游览。

[原只想摘译,到后面差不多全译了。关于 Australia Dancing 与 People Australia 部分,看兴趣再写吧]

参见:
User collaboration in websites / Paper presented by Judith Pearce at Framing the Future, ARLIS/ANZ Conference, 21-23 September 2006.
http://www.nla.gov.au/nla/staffpaper/2006/jpearce1.html

Lorcan Dempsey’s weblog: National Library of Australia 2.0 (October 08, 2006)
http://orweblog.oclc.org/archives/001169.html