瑞典斯德哥尔摩的国家档案馆(Riksarkivet, RA)保存部主任Jonas Palm最近在TAPE (Training for Audiovisual Preservation in Europe)上发表了题为《数字黑洞》的文章(The Digital Black Hole,15页PDF文件),分析RA在数字化及长期保存方面的费用,主要是纸质文献。另有2004年瑞典文化部出版报告《保存声音与图像》中国家音像档案馆(Statens Ljud och Bild Arkiv, SLBA)中音像资料数字化保存方面的数据。
数字保存费用巨大在现在看来应该不是新见解,但用恒星的生命周期来比喻数字化项目的生命周期,用“黑洞”来比喻数字化项目大量吞噬金钱,或许有点新意?(题外话:他对恒星演化的理解似乎有点望“图”生义,想当然)
“没有长期规则,数字化项目就如同天空中的黑洞。经扫描的信息,在模拟世界可以用我们的眼睛简单访问,突然存贮在了一个只有通过使用技术才能检索的环境中,则构成了持续的费用因素。被转换的信息越多,访问费用增长越多。数字黑洞对项目有着稳定的控制力。它将继续吞噬金钱或信息:必须持续投入资金,否则原来的投入就会浪费掉。如果投入资金开始减少,信息可能仍可检索,但由于文件损坏或文件格式过时或技术原因,过一阵子将不再可访问。随后数字信息就永远消失在黑洞中了。”
关于数字保存的一些对比数据:
“在RA,我们基于我们用于数字信息存贮的等级存贮管理系统(Hierarchical Storage Management System, HSM系统)计算费用。用我们的计算结果与Chapman[哈佛大学图书馆Weissman保存中心]的结果比较,相当一致,如图3所示。在两种情况中,比较存贮相同信息量的费用:平均每本书332页,(1)以其原始格式存贮于空调库中,(2)以缩微胶卷存贮于气候控制库中,(3)数字化为600 dpi黑白图像,(4)数字化成300 dpi灰阶(8位)图像。……存贮费用包括需要管理与保存数据的系统,含校验数字一致性、备份过程、校验存贮信息、自动传输到新磁带等。”
“数字存贮费用比一般认为的要高得多,因为包含比大多数人了解的更多的东西。在讨论这些问题中,业界提出,随着存贮增加,经济负担增长更快。”
“存贮介质的能力每年加倍的事实,导致存贮价格快速下降的误解。短期而言――典型地少于五年――是对的,因为保存文件可访问不需要做多少事,但长期而言,管理费用将持续上升。”
“如果作比较,单个2TB硬盘驱动器的费用为450欧元,而一个典型的2TB备份硬件系统可能要10倍的费用,达4500欧元或更多。对于HSM系统,主要费用不是存贮介质,而是围绕的硬软件。”
文章最后提出了一个很不错的省钱的文本保存设想,即以COM(计算机输出缩微胶卷)代替数字化保存:
“RA目前正研究为确保处于不佳状态[纸质]资料上的信息有一个长期的记录,使用COM改善缩微拍摄策略的可行性。RA正考虑将图像文件连同可检索的元数据转换为COM,代替简单的缩微拍摄(如果反之首先生产作为图像文件来源的缩微胶卷,缩微胶卷就会缺少这些检索用数据)。数字图像可以直接使用,但有了COM,就没有必要保存它们,否则就有必要了。未来胶卷可以很快地(再)扫描,以数字方式获取,同时又是可检索的。”
对于古籍之类需要作保护性保存的资料,听说有照相拍摄存档的,国内有没有采用COM的呢?
如果说由于播放设备限制,音像资料无从选择,为长期保存只有转换为数字格式,那很多纸质或文本资料并无此限,面对最终似乎难免进入“黑洞”的数字化项目,为什么还要前仆后继?
绝大部分数字化项目应该以方便利用为目的(包括以保护为目的的保存项目)。如果把费财费力费时的数字化项目当宝贝似地藏着限制使用,或许还没跟多少人打过照面,就走到了生命周期的终点。
精灵真快啊。吴馆长节前把这篇文章发给我们学习,这几天忙着做info20网站,没来得及细看,这回倒省事了。<br>当时粗粗浏览一下,给吴馆长回了一个email,意思是“keven有话要讲”。用一句话讲就是“只不过用极其新颖的“黑洞”概念把图书馆界早已有之的一种反动思潮包装的像那么回事”,很能唬人啊。从社会经济的角度也好,从技术进步的角度看也好,其中的观点实际上几乎不值得一驳。<br>当然提出的问题还是值得我们警醒的。<br>
“反动思潮”?希望等Keven忙完了,听听高论。<br>
同期待keven先生对“反动思潮”的高论。<br>
N年以前(我已经忘了是哪一年了,说不定此话可以追溯至上世纪),国图的大孙馆长孙承鉴在我馆正好有几小时的停留,没有安排什么事。所以我就摊上了这档子陪领导聊天的差事。聊啊聊啊就聊到这档子事,聊到数字化内容如何保存,当时大孙馆长就提出最好是采用COM的方法,同时保存缩微胶卷与数字化文件这两种形式。因为他好象正巧又是全国缩微协会的理事长。当时我还年少嘛,因此就大胆地提出,这样的想法是逆潮流而动的。数字化介质目前的寿命不长是现实,但它的一个长处就是可以或是需要不断地renew,只有在网络上流动着的存储才是最有生命力的。<br>当时大孙馆长提出那种想法还有一个原因是数字存储成本本身还很贵,但现在看来这个不是问题,只是数字存储的管理成本要远远高于我们某些决策者的想象。这是产生数字黑洞的主要原因,我个人认为。<br>就象keven所说的,技术发展、社会发展潮流浩浩荡荡,发展道路上问题是肯定有的,说此篇反动是keven大师的修辞手法,但逆潮流的思维与做法肯定是不足取的。举例来说,我想我们不会将自己电脑上的每篇文档都打印出来以作存档,以规避硬盘不知道哪天就会坏的风险吧?<br>粗粗地看了此篇文档,感觉上与keven很一致,此篇只不过用新颖的‘黑洞’观念将早已有之的思考描述了一把。并且提出了一种比较“反动”的做法。:-)<br>
keven老师那儿好先进,馆长与馆员说话居然是用E-mail。<br>
芙蓉姐姐啊,馆员与馆长说话才用E-mail呢,因为不能随便打扰馆长啊。如果没有E-mail,或许连与馆长说话的机会也没有呢。<br>
上海图书馆员工与馆长、员工与员工之间用E-mail联系已经八年了呢,馆长当然很亲民哦,他是从基层阅览室、采编部干起来的,还是人大代表呢。cat wizard言过其实了,如果没有E-mail,打电话以至面对面共进午餐,与馆长说话的机会多着哩。<br>