数据海和云计算──ICUDL2010会议印象

10月29-30日,在浙江大学参加CADAL主办的第六届全球数字图书馆国际学术研讨会(ICUDL 2010)。
临时替会,去之前对会议一无所知,听会的感觉一是诸多报告均涉及“云计算”,二是听到一种新的说法──“从数据库到数据海”。回来查会议网站,才知道本次会议的主题即是“数据海和云计算”。
与以前参加图书馆界专业会议不同,本次会议不少报告人来自计算机界。因为是国际会议,全英文、无翻译,有些太技术的就完全不懂了。微软亚洲研究院院长洪小文(Hsiao-Wuen Hon)的报告“支持多媒体数字图书馆的技术变革”则是深入浅出,显示了计算机处理多媒体资料的潜力,比如将在雾天拍摄的视频处理成晴天的效果,比如动态的《清明上河图》(不知道是不是就是世博会上的)。
数字图书馆项目方面,互联网档案的Robert Miller介绍其全球图书馆数字化项目(Open Library),卡内基·梅隆大学的Erika Linke介绍百万册图书项目(MBP)十年。浙大计算机学院院长庄越挺介绍CADAL的云计算,以及一些很酷的多媒体技术(比如演示汉字书法),即所谓的智能图书馆。问答阶段,庄院长表示某些演示的内容将在明年上线。
卡内基·梅隆大学的Ram Konduru介绍实验中的通过众包方法更正元数据的研究。通过扫描数字化,元数据通常由外包公司在扫描时制作,其质量始终是个需要面对的问题。使用过CADAL的肯定都有体会,百万册图书的国外部分看来也同样有这个问题。当年我的建议是用图书馆的书目数据与之比对,再辅以人工更正。
除主题报告外,会议有四场分组报告,参加了“云计算与数字图书馆未来”分会场,比较惊艳的是新疆农大馆Eliya Abdukerim的“以云计算建设数字特种共享平台”。介绍将该馆的“新疆动植物标本馆”收藏的新疆特有动植物标本数字化,然后通过Google Apps for Education,辅以python+django编程,建立数字内容共享平台。PPT做得出色,小伙子英语及表达也很棒,听得我很激动。问答时询问网址,说尚在研究中──期待早日在网上看到成果了。
会议资料附光盘,可惜只有论文(大概是要出版的论文集),没有PPT。
———分割线———-