再看国外流行的开源软件──第三届梅隆技术协作奖

   安德鲁·梅隆基金会日前宣布第三届年度梅隆技术协作奖(Mellon Awards for Technology Collaboration (MATC)获奖名单,MATC授予在艺术人文学界的开源软件工具协作开发方面起领导作用的非盈利组织,以及文化遗产领域的非盈利活动。
    2006年首届MATC颁奖,请来了万维网发明人Timothy Berners-Lee,使用开源博客工具WordPress的OPAC前端软件WPOpac获奖(现名Scriblio),引起国外图林博客界一阵喧哗。今年颁奖则请来了“因特网之父”、现任Google副总载的Vint Cerf,在与图书馆界颇为密切的网络信息联盟(Coalition for Networked Information)(http://www.cni.org)2008秋季专责小组会议上颁发。据梅隆基金会的新闻稿,关于颁奖典礼及采访获奖者的播客,可在12月8日后访问CNI网站。但目前CNI及会议网页还没挂上相关内容。

    本年度奖金仍为65万美元,有11项获奖,前二项10万,其余5万。图书馆领域有数字图书馆软件绿宝石及OPAC前端软件VuFind获奖,前者可算元老,后者则是新锐。全部获奖机构及软件情况如下:

* MIT,开发并发布Kerberos网络认证协议(www.mit.edu/Kerberos/)

* 伊利诺伊大学香槟分校,领导并开发Project Archon,一套存档工具(www.archon.org)

* 阿巴拉契亚大学协会(Appalachian College Association),领导LAMP联盟 (http://www.acaweb.org/content.aspx?sid=2&pid=197)

* 卡内基-梅隆大学,开发并发布熊猫3D及爱丽丝三维制作工具(Panda 3D and Alice three-dimensional authoring tools (www.panda3d.org)

* Ecotrust (www.ecotrust.org),开发并发布Open OceanMap,一个让科学家等可以在海洋保护活动上合作的工具 (http://www.ohloh.net/projects/10111)

* Foothill学院(www.foothill.edu),开发并发布Sakai学习管理系统(www.sakaiproject.org)的Mneme测试引擎(http://etudesproject.org/mneme)

* George Mason大学(www.gmu.edu),开发并发布Omeka文化遗产收藏Web展示系统(http://omeka.org/)

* 伦敦国王学院(www.kcl.ac.uk),开发并发布Pliny学术标注工具(http://pliny.cch.kcl.ac.uk/)

* 新西兰Waikato大学(www.waikato.ac.nz),开发并发布绿宝石项目(Project Greenstone),一套创建数字图书馆的工具(www.greenstone.org)

* 华盛顿大学,开发并发布WebAnywhere,一个增加视障人员访问及流动性的项目(www.webanywhere.cs.washington.edu/)

* Villanova大学(www.villanova.edu),开发并发布VUFind项目,学术图书馆资源门户软件(resource portal software for academic libraries) (www.vufind.org)

关于MATC及2006年首届获奖情况,参见:从获奖看国外流行的开源软件 (2006-12-07)

关于VuFind,参见:
开源OPAC发布:VuFind (2007-07-23)
SEOmoz的Web2.0奖 & 我用的获奖网站 (2008-08-18)

关于Greenstone,参见:
绿宝石数字图书馆开源软件(Greenstone) (2006-06-07)

LC21:美国国会图书馆数字策略

    朋友推荐一份2000年美国国家研究委员会(National Research Council, NRC)的研究报告《LC21:美国国会图书馆数字策略》,网上可阅读全文。这8年间,图书馆数字化发展日新月异,可以作为历史看。

        1990年代,数字化、网络化新型信息大量出现,旧模式已经动摇、新模式尚未形成(But no clear new
paradigm has emerged, even as the old one is
shaken)。1998年,NRC的计算机科学的电信委员会(CSTB)受LC之邀,成立LC信息技术策略委员会,审核该馆信息技术规划与实施状态,以
帮助LC处理面临的严峻形势,并帮助LC完成其使命。委员会的任务不是替LC开药方,而是全面梳理LC的服务与设施。形成的这份报告向LC提出了一些强有
力的告诫。
    报告一开始就针对现状,提出了以下五个当时尚无答案的问题,现在也很难说已经有了答案:
1、西方图书馆的鲜明特点仍将存续吗?
2、公共图书馆仍将广泛及免费地提供保存的信息吗?
3、大型研究图书馆仍将是其选定用户群的信息入口吗?
4、在急于利用互联网的普遍冲击下,数字信息与印刷信息会成功整合,抑或印刷信息将失去其威望?
5、会出现新的知识集成者和组织者(或许出自商业部门),绕过图书馆,找到直接把信息成功交到用户手中的途径吗?

    报告从六个方面对LC进行了分析,并提出建议。现在看来,其中有些是LC在做,有些并未被接受?
1、建设数字馆藏
    包括长期保存、门户模式,接受原生数字资源、与其他系统集成、建立数字资料新标准,寻求修改版权法、收割存档美国网站、建立收集网站政策,收集各类数字资源相关政策(著录与编目、访问、保存)、需要具有高技术能力的专业馆员

2、保存数字遗产

3、组织数字信息访问:从编目到元数据(p.11-12)
   
LC在协调编目标准方面曾经并将继续起着基本作用,这些标准使合作编目成为可能。这种协调应当继续,并且LC应该考虑如何将其作用延伸并转换到互联网环境
下。过去主要在图书馆界内的协作策略已经不够了,因为现在出现了新的重要的利益相关人,如Web搜索公司及联系出版商。
发现:LC大量参与创建与使用元数据,曾长期担当标准建立与初践的领导者。但是,元数据环境演变迅速,这将不但深刻地影响图书馆与其他信息提供者,也影响LC。LC乃至全国,有责任起领导作用,以造福于全国乃至全世界的信息提供者与使用者。
建议:LC应当把开发一个更丰富也更复杂的元数据环境作为一个策略问题,大幅度增加其在这方面的参与及规划,应当更积极地投身于图书馆及信息界在推进元数据实践演变的工作。这需要奉献资源,馆长直接介入制定与调整预期,以及强有力地承诺由LC执委会指定一位项目负责人。
建议:LC应当积极鼓励和参与开发自动创建元数据工具。这些工具应当与编目工作流程整合。

4、LC与世界:跨越围墙
    协作与合作:数字出版与数图研发领域的利益相关人,改进与OCLC及RLG关系,与其他联邦机构(NLM, NAL, NARA, 史密森学会)建立日常高级政策关系

5、管理问题

6、信息技术基础设施

来源
LC21: A Digital Strategy for the Library of Congress / Committee on an
Information Technology Strategy for the Library of Congress, Computer
Science and Telecommunications Board, Commission on Physical Sciences,
Mathematics, and Applications, National Research Council. Washington,
D.C. : National Academy Press, 2000. ISBN 0-309-07144-5
目次:
Executive Summary (1-22)
1. Digital Revolution, Library Evolution (23-49)
2. The Library of Congress: From Jefferson to the Twenty-First Century (50-81) LC从杰弗逊到21世纪
3. Building Digital Collections (82-104)
4. Preserving a Digital Heritage (105-121)
5. Organizing Intellectual Access to Digital Information: From Cataloging to Metadata (122-143)
6. The Library of Congress and the World, Beyond Its Walls (144-162)
7. Management Issues (163-192)
8. Information Technology Infrastructure (193-213)
Afterword (214-216)
Bibliography (217-240)
Appendix A: Biographies of Committee Members (241-252)
Appendix B: Briefers at Plenary Meetings and Site Visits (253-260)
Appendix C: List of Letters Received (261-261)
Appendix D: Acronyms (262-266)

《盛宣怀档案》全文数据库开通

    上半年的时候,在Keven办公室遇Sogg的朋友,来上图查盛宣怀档案未果。因之对上图的盛宣怀档案有了印象,今天看到《文汇读书周报》11月28日头版头条──“盛档”:抹去百年尘封还历史真相──上图的“盛档”数字化已经完成,提供78.7万拍的网上全文查阅系统。研究中国近代史又多了一批丰富的第一手资料。
    与此同时,11月25日到12月8日,“上海图书馆藏盛宣怀档案展”正免费开展。在上图网站的新闻──走近盛宣怀 近代史如此“鲜活”称档案有近16万件、1亿多字,并有多幅彩色扫描件。从外行角度,尽管没有看到编目记录,但只看那几件档案图像,就觉得整理编目者俱是高手,绝对不是看书只看封皮的我等能做的。
    在《文汇读书周报》的报道中,上图副馆长、盛宣怀档案研究中心办公室主任周德明总结全面整理“盛档”的主要意义,包括文献价值、工作方法及学术价值。文献价值、学术价值关注者自然清楚──Sogg的朋友从厦门跑来上海就是一个佐证。从工作方法角度的总结引述如下:对图书馆来讲,“盛档”的整理编目为大型图书馆未编文献整理开发积累了经验,对以后其他图书馆开展类似文献整理提供了可供借鉴的工作方法。
    据《文汇读书周报》报道的数据,整理工作从1997年7月到2005年年底,超过了8年。在此基础上,原件扫描就比较简单了,从2006年9月到2008年8月,共2年。

    上月到上图讲图书馆2.0,最后回答提问阶段,曾斗胆质疑上图秘藏众多宝贝不示人的做法,当时周德明馆长说明是担心资源不能得到合法使用。这个大家都清楚,中国互联网及知识产权保护的现状基本上是“你的就是我的”,拿别人东西卖钱也是普遍现象。如此恶劣生态,阻碍了图书馆资源的开放。不过,当时我说了自己的看法:道高一尺、魔高一丈,只要愿意想办法,总可以解决的。
    目前在上图网站的特色馆藏文献与服务中尚未看到《盛宣怀档案》的介绍,估计是提供局域网浏览?如果暂时无法解决资源保护问题,相信至少“盛档”的目录应该可以提供广域网上的检索、浏览。

[update 2008-12-1] 新华每日电讯2008-11-26:盛宣怀档案在沪对公众开放
    25日,晚清企业界领袖盛宣怀的历史档案在上海图书馆对公众开放展出。同时,拥有近16万件、1亿余字史料的盛宣怀档案,也全部上载上海图书馆局域网,供海内外专家学者浏览查询。