中美数图研讨班2008·数字资源长期保存

    去年参加了国家科技图书文献中心(NSTL)与雪城大学(Syracuse)在中科院上海生命科学信息中心举办的第三期中美数图研讨班,完成了三门课。今年继续参加第四期,完成另三门课。每三天一门课,这一周已经完成了二门,第一门是数字资源长期保存。
    刚开始做数字图书馆相关工作时,首先关注的就是如何能使我们自己数字化的资源能够长期可用。关注的结果发现自己属于杞人忧天,基本上只要随大流就可以了。不过那是自己瞎琢磨的结果,此次能系统化地听“数字资源长期保存”的课,还是有所期待的。
    开课前教务就发来了预习资料,是康奈尔大学2003年的数字图像入门教程:Moving Theory into Practice: Digital Imaging Tutorial。有PDF版,打印出来百多页,到开课前只看了前半部分,另配合联机版,看其中一些小测试的是不是做对了。上课时发下来的讲义中还有更多的参考文献,只是在三天时间内上完一学期的课,每天疲于奔命,基本上没有时间看。
    授课老师Kenneth Lavender,课程内容比较平淡。张晓林馆长在开班仪式后参加了差不多半天的课,显然也感觉到了,所以在课间休息时大讲了一通数字资源长期保存的重要性,听着像是给我们打气。
    课程的主要收获有二,一是让自己认真看了关于“开放存档信息系统”(OAIS)的资料,再也不会弄不清OAIS与OAI了;二是知道了“差距分析”(Gap Analysis)。

关于OAIS:
定义(Libpedia: OAIS
OAIS,即开放档案信息系统(Open Archival Information System)的简称,一项旨在为基于长期保存目的的信息系统建立一个参考模型和基本概念框架,以维护信息系统中数字信息的长期保护和可存取,目前该模型 已成为ISO 14721:2003国际标准。该标准由the Consultative Committee for Space Data Systems负责研究开发。

推荐阅读:开放档案信息系统(OAIS)介绍(《中国科学院数字档案馆建设方案》课题研究的部分内)

相关:中美数字图书馆高级研讨班网站
“本研讨班以两年为一期,共六门课程。每年三门课程(预计80学时),共10天[实际是12天]。第一年度完成数字图书馆概论、数字图书馆服务规划与评价、XML在数字图书馆中的应用,第二个年度完成数字资源保存、人机交互与数字图书馆、知识组织系统设计与应用三门课程。”

参见:
数字黑洞 (2006-05-08)
中美数图研讨班(5)·数字图书馆还要自建吗?(2007-05-31)
  该博文后附第三期研讨班系列博文链接

批量更名专家·行业规范

    各行各业都有自己的规范,训练有素的人员必定严格遵守这些规范。
    每次去修表,修表工的最后一道步骤总是对表,把时间校正──哪怕我修的是表带。
    图书积压,领导决定套录记录不必修改,可老资格的编目员看到不符合要求的记录总忍不住去改一下──哪怕不计算工作量。
    前些天,见识了电子书制作的规范。    

    本馆有一批用清华同方TPI制作的电子书,扫描文件名形如XXXXX.001系列。现在打算制作成CADAL格式的电子书,首先需要将文件名改为8位流水号。一位同事在网上找来“批量更名专家(RenameWiz)”,只要选择“替换”,将原来的“XXXXX.”替换成5个0就搞定了。
    制作电子书的同事在转换过程中,发现一些书原来的文件名不规范,或者不是从001开始,或者中间跳号。她看不过眼,逐一改成从1开始顺序编号的──哪怕改得手酸脖子痛。
    我以为那是无伤大雅的,不影响最后阅读就可以了。不过既然她有自己的规范,也应该支持──看一下批量更名专家,有“序数”改名功能,只要把开始字符设为00000001,增长设为1,一下就搞定了。
    冰雪聪明的她立刻悟出──都用这种方法,不是简单得多?正是!原来就想着要“改名”,没想到还可以用“序数”方式改名。

    如果你也有大批文件需要改名,强烈推荐“批量更名专家”──还有很多功能,随你想怎么改,估计只有想不到、没有做不到的。

“Web/Lib2.0”第三次研讨会参会侧记(下午)

    万二在上午的会议侧记下留言“哦,怎么个不严肃法?”,看得我就像在博客颁奖时,万二看到游园手势而不敢应超平要求提“最刁难游园的问题”一样,决意改变初衷,严肃记录下午的会议。可是下午会议太过热闹,难免让人几乎不记得上午还曾有过那么严肃认真的报告。
    听说会议网站将不存焉(希望厦大或上交大克隆一个备份),所以严格记录会议日程。如果想不严肃的……自己去看视频。
    
    下午开始前,叶鹰往台上放酒和香烟(视频5),为“专题互动──技术酒徒PK人文烟鬼”作准备。本部分由技术酒徒代表刘炜和人文烟鬼代表程焕文主持(视频6,可惜只有1和2的前半部分),PK话题:
1、数字图书馆和图书馆2.0的发展会导致无纸图书馆吗?
2、2.0时代究竟是让MARC安乐死还是让MARC继续活?
3、技术与人文:谁能引领图书馆事业跑得更快?Why?
    这是一场“大专辩论赛”──凡是敌人反对的、我们就要支持,凡是敌人支持的、我们就要反对──主持人是一辩,以摆放在台上的烟酒为诱誀招募其他辩手,而参与直播的网友则在超平的转达下发表的意见。会场上送酒递烟不亦乐乎!开始Keven送酒很大方,甚至一次两瓶,后来大概怕送完了没人支持而“惜送”,以至到结束时台上还剩了两瓶劲酒。除了主办者的烟,斋主还把自备的非常特别的国内买不到的高级烟送给了最支持“他的观点”的俺;后来则在参与者的要求下,送烟时奉上“吸烟有害健康”的人文关怀。
    如果不想看长达一小时的“无聊”录像,PK过程可参见老槐也博客“图书馆2.0会场速记”。第2个话题将另文陈述──欢迎关注。
    
    接下来的“博客报告”是可与上午匹敌的最严肃的部分,充分显示几位的研究能力(视频7)。范并思主持。
1、秦鸿:Lib2.0:谁持彩练当空舞(关于图书馆员2.0)
2、刘青华:参考咨询断想2.0
3、钟远薪:Ajax在图书馆中的应用(如需相关代码,可索取)
4、金武刚:图书馆员精神生活大写真(大旗底下QQ群年度报告,使用多种分析工具)
    四位依抽签决定上场顺序(但大旗与丫枝自换顺序)。最后会议日程上的候选者之一王波志愿上场、即兴发言,其中建议中图学会整合影响颇大的2.0会议与青年论坛。此建议后被keven称为“招安”──如上午[二次与会的]台大陈光华教授从与会者衣着上所感受到的,2.0会议越来越正式了。

    第三部分“博客颁奖”,李超平主持(视频8)。从一开始,我就把“中文图林博客奥斯卡奖”看作一场游戏,却也没料到竟会以如此好玩儿的方式结束。首次见到超平是在第一次2.0会上,看她主持“博客通缉”。此次超平故伎重演,又临时请来现场嘉宾颁奖,气氛之活跃可以想像。由于奖项泛滥,将另文再述──强烈反对讨厌一小撮人者看该文。

    第四部分《图书馆2.0:升级你的服务》作者亮相,李超平、郭晶主持。这是日程计划中没有的新增节目,与会作者在金妮的介绍下一一登场,并发表感言,共有十多位。金妮的介绍语估计会发表在她的博客上,只把吹捧自己的那段记录在此:“ta是很多人的博客启蒙和专业偶像,ta在网海闲游的同时,把专业信息及时向同行撒播。ta的博客被誉为知识宝库,ta的工作经历也证明,从事图书馆传统的编目工作,也可以非常2.0”。本部分以作者合影结束。推荐该书Wiki网址:http://www.dlresearch.cn/WG1/。
    附游园感言:我只写了很少的部分……感叹我的人生已经走到了残酷的冬天。
    附小钟感言:写这本书让我重新认识了图书馆学。

    会议最后环节是自愿申办下次会议──结果是重庆大学接办。晚宴时举行了交接仪式,用的是和红黄牌一套的绿牌,上书“交接”二字。

参见:
数图研究笔记:谢幕还是招安?
《图书馆2.0:升级你的服务》新鲜出炉
无方乱语:热闹的2.0会议

天天天蓝 日日书香:让我们一起来做梦 [update 2008-4-15]
书间道:这真是个青春的盛会──在“web/lib2.0:西湖论剑”会上的发言 [update 2008-4-16]

“Web/Lib2.0”第三次研讨会参会侧记(上午)
2.0时代究竟是让MARC安乐死还是让MARC继续活?
“Web/Lib2.0”第三次研讨会博客颁奖