TALIS与图书馆2.0

    TALIS是英国的一家图书馆公司,有自己的图书馆集成系统产品,也提供书目服务,原本影响只在英国爱尔兰。但从2005年10月考古学博士Paul Miller加盟TALIS,成为它的技术传道者(Technology Evangelist),利用“图书馆2.0”的概念,使TALIS名声大噪:

    2005年10月,Paul Miller在电子期刊Ariadne上发表“Web 2.0:建设新图书馆”(Web 2.0: Building the New Library),引人注目的“Web 2.0 + Library = Library 2.0?”,是正式出版物中首次提出目前意义上的Lib 2.0,而文章本身,也成为lib 2.0的重要文献。
    2006年4月,Paul Miller又在另一电子期刊D-Lib Magazine上发表文章“Coming Together around Library 2.0”,进一步阐述其Lib 2.0观点。
    Paul Miller还先后发布了TALIS的两份Lib 2.0白皮书:

  • Do Libraries Matter? The Rise of Library 2.0(by Ken Chad & Paul Miller,2005年11月,PDF文件
  • Library 2.0 – The Challenge of Disruptive Innovation(2006年2月,PDF文件

    TALIS原本有多个Blog,2005年10月发布播客(Podcast)“Talking with TALIS”,与业界有影响的人物进行交谈,很多内容涉及Lib 2.0。可以在线收听,也可下载MP3文件。
    11月,TALIS发布其Lib 2.0研究原型系统Whisper,引起关注。
    TALIS在英国以外扩大影响,2005年11月与美国研究图书馆集团合作,使RLG联合目录RedLightGreen能够直接链接到本地OPAC(随着马上到来的7月1日,RLG并入OCLC,这种合作还能继续吗?);2006年4月与名列前茅的ILS公司Endeavor成为策略伙伴。
   
    最近,TALIS宣布主办全球性的图书馆Mashup竞赛“Mashing Up The Library”,目的是鼓励图书馆数据的显示、使用与复用,用地图、评论、图书封面、大众分类等强化OPAC。   
    比赛评委包括因发布新版OPAC大出风头的北卡州大学图书馆的Andrew Pace,Lockergnome的Chris Pirillo,Ann Arbor地区图书馆的超级用户Ed Vielmetti,去年加盟Ask.com的“资源架”出版者Gary Price,刚主持完ALA图书馆2.0训练营的著名博客Jenny Levine (The Shifted Librarian),设计出LibraryLookup的Jon UdellLibraryThing个人在线书目的Tim Spalding以及TALIS的Paul Miller。后来还加上了Amazon的Web服务传道者(Web Services Evangelist) Jeff Barr,可谓阵容强大。
    首奖1千英镑。比赛截止期为8月18日,结果于9月公布。

 

绿宝石数字图书馆开源软件(Greenstone)

    绿宝石数字图书馆软件是建立与分发数字图书馆馆藏的软件套件,它提供在互联网或CD-ROM上组织与出版信息的新途径。“绿宝石”由Waikato大学的新西兰数字图书馆项目制作,与联合国教科文组织及人类信息非政府组织(Human Info NGO)合作开发与发行。它是在GNU通用公共许可条款下发布的开源多语种软件。
     前不久有人在IFLA的数字图书馆邮件组(DIGLIB)中征求使用绿宝石软件创建数字图书馆的相关信息,在2006年4月5月的邮件组存档中可以看到十多个回复。从回复信息来看,绿宝石似乎特别适合进行数字图书馆教学,当然具体应用的实例还是比较多的。总体评价可以归结为“界面直观,使用基本模板就可以很方便地建立起数字图书馆,但如果要修改外观与行为则比较麻烦”。
    重要参考资源除绿宝石本身的网站(http://www.greenstone.org)外,还有绿宝石的两位开发者Ian H. Witten和David Bainbridge所撰图书“How to Build a Digital Library”。两位开发者在《图书馆高技术》开源软件特辑(Library Hi Tech, v.23(2005),no.4:pp541-560)上的专文“Creating digital library collections with Greenstone”,可以作为入门读物。

    UNESCO作为合作方,一直推动绿宝石在发展中国家的应用。最新信息是2006年2月在泰国曼谷举行“数字图书馆教育”特别培训,由开发者David Bainbridge和David M. Nichols博士主讲,从数字图书馆的概念、各种文献的收集及通过CD-ROM或网络链接等形式发布的方法、图片与声音文件、MARC格式与书目数据、多媒体数字图书馆、开放标准与交互处理等多个角度,介绍Greenstone软件的使用方法。

    国内情况,北京大学图书馆早在1998年就与新西兰数字图书馆合作,利用绿宝石系统进行了拓片项目和学位论文文摘及索引项目的建设。清华大学图书馆郑晓惠在2004年数字图书馆前沿问题高级研讨班上对Greenstone有过介绍(见“开放源代码内容管理系统Fedora”PPT)。年心在2005年5月18日也介绍了“Greenstone数图开源软件”,从一问的评论看,他也试用过。
    清华大学图书馆张首红和姜爱蓉的“数字图书馆系统开源软件的比较分析”《图书馆杂志》2006第1期(总第25卷第177期)大概是对绿宝石最全面的分析论文了,值得一读:“本文对三种国外的数字图书馆系统开源软件(Fedora、DSpace、Greenstone)进行了介绍和比较分析,以期深入理解和领悟数字图书馆开源软件的设计理念,为国内从事数字图书馆系统开发和设计的同行提供参考。”从文中所作比较看,绿宝石各方面都不错,但“将所有的文档都转换成Greenstone特有的存档格式存入收藏中”???
    或者可以大材小用,专做CD-ROM,为个人建文集?

 

数字黑洞

    瑞典斯德哥尔摩的国家档案馆(Riksarkivet, RA)保存部主任Jonas Palm最近在TAPE (Training for Audiovisual Preservation in Europe)上发表了题为《数字黑洞》的文章(The Digital Black Hole,15页PDF文件),分析RA在数字化及长期保存方面的费用,主要是纸质文献。另有2004年瑞典文化部出版报告《保存声音与图像》中国家音像档案馆(Statens Ljud och Bild Arkiv, SLBA)中音像资料数字化保存方面的数据。
    数字保存费用巨大在现在看来应该不是新见解,但用恒星的生命周期来比喻数字化项目的生命周期,用“黑洞”来比喻数字化项目大量吞噬金钱,或许有点新意?(题外话:他对恒星演化的理解似乎有点望“图”生义,想当然)

    “没有长期规则,数字化项目就如同天空中的黑洞。经扫描的信息,在模拟世界可以用我们的眼睛简单访问,突然存贮在了一个只有通过使用技术才能检索的环境中,则构成了持续的费用因素。被转换的信息越多,访问费用增长越多。数字黑洞对项目有着稳定的控制力。它将继续吞噬金钱或信息:必须持续投入资金,否则原来的投入就会浪费掉。如果投入资金开始减少,信息可能仍可检索,但由于文件损坏或文件格式过时或技术原因,过一阵子将不再可访问。随后数字信息就永远消失在黑洞中了。”

关于数字保存的一些对比数据:缩微、纸质与数字化的费用比较

    “在RA,我们基于我们用于数字信息存贮的等级存贮管理系统(Hierarchical Storage Management System, HSM系统)计算费用。用我们的计算结果与Chapman[哈佛大学图书馆Weissman保存中心]的结果比较,相当一致,如图3所示。在两种情况中,比较存贮相同信息量的费用:平均每本书332页,(1)以其原始格式存贮于空调库中,(2)以缩微胶卷存贮于气候控制库中,(3)数字化为600 dpi黑白图像,(4)数字化成300 dpi灰阶(8位)图像。……存贮费用包括需要管理与保存数据的系统,含校验数字一致性、备份过程、校验存贮信息、自动传输到新磁带等。”
    “数字存贮费用比一般认为的要高得多,因为包含比大多数人了解的更多的东西。在讨论这些问题中,业界提出,随着存贮增加,经济负担增长更快。”
    “存贮介质的能力每年加倍的事实,导致存贮价格快速下降的误解。短期而言――典型地少于五年――是对的,因为保存文件可访问不需要做多少事,但长期而言,管理费用将持续上升。”
    “如果作比较,单个2TB硬盘驱动器的费用为450欧元,而一个典型的2TB备份硬件系统可能要10倍的费用,达4500欧元或更多。对于HSM系统,主要费用不是存贮介质,而是围绕的硬软件。”

    文章最后提出了一个很不错的省钱的文本保存设想,即以COM(计算机输出缩微胶卷)代替数字化保存:

    “RA目前正研究为确保处于不佳状态[纸质]资料上的信息有一个长期的记录,使用COM改善缩微拍摄策略的可行性。RA正考虑将图像文件连同可检索的元数据转换为COM,代替简单的缩微拍摄(如果反之首先生产作为图像文件来源的缩微胶卷,缩微胶卷就会缺少这些检索用数据)。数字图像可以直接使用,但有了COM,就没有必要保存它们,否则就有必要了。未来胶卷可以很快地(再)扫描,以数字方式获取,同时又是可检索的。”

    对于古籍之类需要作保护性保存的资料,听说有照相拍摄存档的,国内有没有采用COM的呢?

    如果说由于播放设备限制,音像资料无从选择,为长期保存只有转换为数字格式,那很多纸质或文本资料并无此限,面对最终似乎难免进入“黑洞”的数字化项目,为什么还要前仆后继?
    绝大部分数字化项目应该以方便利用为目的(包括以保护为目的的保存项目)。如果把费财费力费时的数字化项目当宝贝似地藏着限制使用,或许还没跟多少人打过照面,就走到了生命周期的终点。