国家数字图书馆标准规范建设

    《数字图书馆论坛》2008年第8期,是为配合9月9日国家图书馆建馆99年、国家图书馆二期暨国家数字图书馆开馆而出的“国家数字图书馆工程专刊”,十篇文章都是宏大叙事。自己感兴趣的是“国家数字图书馆标准规范建设”(赵悦、申晓娟,p.37-42)。

    在做数字化相关工作前,除了都柏林核心,对相关标准几乎一无所知。后来先看网上的“中国数字图书馆标准与规范建设”,再看厚厚一大本的《中国高等教育数字图书馆技术标准与规范》,最后看CADAL的技术规范。基本上到哪个山头唱哪个歌,跟着参与项目的要求走。现在要出现第四个重量级的标准规范了,今后可以挑先前几个项目中没有的规范跟着走了。

3 国家数字图书馆工程标准规范建设规划
3.1 建设目标
(2)立足于国内外已有标准规范成果,为国内其他数字图书馆系统建设提供指导性、示范性规范,并力争使国家数字图书馆工程中采用或研制的成熟标准规范转化为国家标准,从而促进全国数字图书馆建设的标准化进程。
3.2 建设原则
(1)优先选择成熟标准
(2)开放建设原则:全部采用公开招标;成果广泛征求机构及专家意见
(3)核心建设原则
(4)注重应用原则
3.3 建设类型
(1)遵循标准类:ISO 10646(Unicode),GB18030《信息交换用汉字编码字符集基本集的扩充》,OAI-PMH,ISO 15836(DC),MARC等
(2)参考标准类:ISO 14721(OAIS)
(3)待建标准类
(4)修订标准类

4.2 标准规范建设核心内容 / 表1 国家数字图书馆工程标准规范建设项目一览表
项目:汉字处理规范
  汉字属性字典(委托中华书局研制)
  中文文献全文版式还原与全文输入XML规范(委托中易公司研制)
  古籍用字规范(计算机用字标准)(委托中华书局研制)
  计算机中文信息处理规范(委托中易公司研制)
  生僻字、避讳字处理规范(委托中华书局研制)
项目:唯一标识符
  国家图书馆数字资源唯一标识符规范(委托中科院文献情报中心研制)
项目:对象数据
  国家图书馆数字资源对象管理规范
  文本、图像、音频、视频数据加工标准与工作规范
项目:元数据总则
  国家图书馆元数据应用规范
  国家图书馆核心元数据标准
  国家图书馆专门元数据设计规范
  CNMARC XML [期待这个]
  CNMARC-DC-国家图书馆核心元数据集的对照转换  [上图早在2001年就做了CNMARC-DC的对照转换]
  MARC21-DC-国家图书馆核心元数据集的对照转换
项目:专门元数据规范──古文献
  专门元数据标准与著录规范──拓片、舆图、甲骨、古籍、家谱
项目:专门元数据规范──电子书刊
  专门元数据标准与著录规范──电子图书、电子连续性资源、学位论文、期刊论文
项目:专门元数据规范──网络及多媒体资源
  专门元数据标准与著录规范──网络资源、音频、视频、图像
项目:管理元数据
  国家图书馆管理元数据规范
项目:知识组织
  知识组织规范
项目:资源统计
  数字资源统计标准
项目:长期保存
  国家图书馆数字资源长期保存规范

    对于国图标准规范建设的某些方面,CDLS显然有异议。其官方网站首页有2008年5月26日的“《我国数字图书馆标准与规范建设》成果应用要求”,看着耐人寻味:“任何机构在研究或应用中利用本项目成果时,必须保护国家对于本项目成果的完整权利,必须保证不以任何形式将国家拥有和开放获取的本项目成果转移为任何机构或个人专属的成果,必须保证利用本项目成果生成的新成果中所包含的本项目成果内容的国家权属和开放获取,必须保证项目组和项目成果完成作者的合法权益(包括但不限于署名权)。参加本项目研究的任何机构或个人也都无权将本项目成果转让给任何第三方。”

相关链接:
国家图书馆:中国数字图书馆工程(China Digital Library Project)
    [update 2008-10-27] 国家数字图书馆工程标准规范规范质询
《我国数字图书馆标准与规范建设》项目(Chinese Digital Library Standards, CDLS)

 
 
[update 2008-10-27]
国家图书馆数字资源唯一标识符规范公开质询
公开质询时间:2008年10月25日——11月7日
公开质询内容:1.国家图书馆唯一标识符规范
                   2.国家图书馆唯一标识符规范应用指南
国家数字图书馆工程标准规范项目成果公开质询征求意见单

 

《末日审判书》的末日

    1986年,英国广播公司(BBC)花了250万英镑为《末日审判书》制造了一个多媒体的计算机软件复制品。《末日审判书》是11世纪诺曼僧侣编制的英国统计资料。电子《末日审判书》内容超过了真本,包括了25万个地名,2.5万张地图,5万张图片,3000套资料,60分钟电影,外加几十份《英国生活》的说明。参加这个工程的超过100万人。资料储存在12英寸的光盘上,只有BBC的特殊计算机才能显示处理。16年过去了,2002年3月,有人想用同样的计算机来阅读光盘上的资料,却没有成功。接着又试了许多办法,没有一个是完全成功的。兰德公司的杰夫·罗森贝格(Jeff Rothenberg)是资料保存的世界级专家,被请去协助解决问题。他说:“当前还没有明显有效的技术解决问题。然而,如果问题不能解决,我们日益增加的数码资产就有丧失的严重危险。”相比之下,《末日审判书》的原件已经有1000千寿命了,它写在纸上,保存在丘市(Kew)的公共档案局里,状况良好,完全适于阅读。
    2004年11月,美国国家档案记录局电子档案处的处长公开承认,将电子资料保存10年以上(更不用说永远保存),“仍然是全球性难题。各大国政府,大公司,以至个人都解决不了。” [出处:Katie Hafner, "Memories on Computers May Be Lost to Time", in The International Herald Tribune (Paris, 28 Nov. 2004)]

──《夜晚的书斋》(p.68-71)

    对“数字黑洞”已经不像当初那样战战惊惊,但看到实例,还是想记下来。虽然书中所说参加工程人数超过100万似乎不太可信(人均工资2.5英镑?),但主要事实应该没有疑问。

《夜晚的书斋》中的图书馆员

    《夜晚的书斋》,图书在版编目的主题是“图书馆──通俗读物”,而原书"The library at night"在西文书目中的主题是“图书馆”、“图书馆──历史”和“图书与阅读──历史”。此书延续《阅读史》的风格,在东拉西扯之间,引入大量图书馆、图书与阅读的历史。
    漫谈图书馆史,不免涉及馆长。作者学生时代曾为博尔赫斯朗读(见《阅读史》p.18-22),这位曾提出“天堂是图书馆模样”的盲人馆长在书中便多次出现。
    在馆长们的众多见解中,印象最深的是300年前,德国著名数学家、哲学家兼法学家莱布尼茨(Gottfried Vilheim Leibnitz)已经说过,图书馆的价值只在于其内容以及读者对内容的利用,而不在于藏书的数量和珍藏的稀有程度。(p.84)

    因为是漫谈,所以在馆长的高瞻远嘱之外,还有各异其趣的普通馆员(小标题为本人所加):

造假
1990年代,由于旧金山图书馆新馆大楼没有足够空间来摆放书籍,市政当局决定从图书馆内撤出几十万册藏书,充当填土之用,凡长期无人借阅的书刊都以此种办法销毁。为了尽力挽救大量的书籍,图书馆的管理员表现出英勇精神,乘夜间偷偷进入书库,把虚假的出借日期印在即将清除的书本上。(p.67,出处:Nicholson, Baker, "The Author vs. the Library", The New Yorker, 14 Oct. 1996)

偷盗
在纳粹分子开始掠夺毁灭犹太图书之后,肖勒姆·阿莱汉姆图书馆(Sholem Aleichem Library)馆长决定尽力挽救这些图书。他和另一位馆员每天都从馆里偷偷带走一些书。两星期后这些书被移到一个秘密的阁楼里,直到二战结束后很久,才被历史学家波尔齐科夫斯基(Tuvia Borzykowski)发现。(p. 216)

无知
1930年穆齐尔(Robert Musil)描写一个勤恳的馆员在维也纳皇家图书馆工作,他熟悉这个巨大馆藏中每一本书的书名。“你想知道我是怎样熟悉这些书名的吗?”他对表示惊异的客人说:“我完全可以坦白告诉你,这是因为我一本书也没读过。”他又说:“每一个出色的图书馆员的秘诀就是,凡是委托他管理的书,一本也不要读,只记住书的名称和目录。只要钻进了书本,就会迷失方向,他就永远掌握不了图书馆的全貌了!”(p.232,出处:Robert Musil, Der Mann ohne Eigenschaften. Berlin :Ernst Rowohlt, 1930)

疯狂
法国女作家柯莱特的朋友保罗·梅森(Paul Masson)有一次到她海边别墅来,从衣袋中取出钢笔,一小叠卡片和一块写字用的木板,称“我被派到国家图书馆编目部工作,现在我要编书目清单。”她感到奇怪:“你凭记忆编目吗?”他解释说:“……我知道国家图书馆缺少15世纪的拉丁文和意大利文图书。我现在正在开出应当有人写的十分有趣的书名清单。……至少,这些书名可以给图书馆目录挣点面子……”。(p.257,出处:Collette, in Mes apprentissages. Paris : Ferenczi et fils, 1936)──此人后来自杀:站在莱因河边,鼻子里塞满浸透乙醚的棉花,失去知觉后倒在一英尺深的水中淹死。或许原就是图书馆中众多精神病患中的一员。

别样疯狂
1945年5月,当捷克爆发反纳粹起来,俄国军队开进布拉格的时候,作家纳博科夫的姐姐埃莲娜·西科丝卡雅(Elena Sikorskaja)正在图书馆工作,她知道德国军官准备逃走了,但他们借的图书尚未归还。她和一位同事决定把这些书要回来。她们穿行在俄军胜利前进的街道上去挽救图书。她后来写信告诉弟弟:“我们找到了德国飞行员的住处,借书的人冷静地把书还了。可是到那时候,主要马路止已经禁止通行了,到处都是德军架起的机关枪。”(p.294,出处:Vladimir Nabokov/Elena Sikorskaja, Nostalgia, letter of 9 October, 1945. Milano : Rosellina Archinto, 1989)

骑驴

哥伦比亚农村的驴背图书馆(p.209)。上图来自Flickr:BIBLIOBURRO
在YouTube找到的视频Biblioburro,很生动的农村流动图书馆(Biblioteca rural ambulante)活动:

还有Biblioburro 2,流动图书馆本部似乎徒有四壁。

夜晚的书斋 / (加拿大)阿尔贝托·曼古埃尔著;杨传纬译. 上海人民出版社,2008.8 ISBN 978-7-208-07644-0
The Library at Night / Alberto Manguel. 2006

附目录:
前言
书斋──神话 [巴别塔、亚历山大图书馆]
书斋──秩序 [目录学与图书馆目录]
书斋──空间 [百科全书、数字化]
书斋──力量 [卡内基]
书斋──影子 [禁书、毁书](介绍:禁书:图书馆的影子,《文汇读书周报》2008-08-29)
书斋──形状 [建筑,米开朗基罗设计建造佛罗伦萨的洛伦佐图书馆]
书斋──机遇 [敦煌]
书斋──工作室 [作家、博尔赫斯]
书斋──心思 [阿比·瓦尔堡图书馆]
书斋──岛屿 [鲁宾逊、驴背图书馆]
书斋──幸存物 [纳粹、十字军]
书斋──遗忘 [屠格涅夫图书馆、伊拉克国家图书馆]
书斋──想像 [博尔赫斯、拉伯雷、圣诞老人图书馆、希特勒藏书]
书斋──品格 [彼特拉克、国家图书馆、帕尼奇]
书斋──家
结语

参见老槐也博客:走近《夜晚的书斋》(2008-09-04)
关于《阅读史》,参见:空袭过后的图书馆读者(2008-09-14)