LC21:美国国会图书馆数字策略

    朋友推荐一份2000年美国国家研究委员会(National Research Council, NRC)的研究报告《LC21:美国国会图书馆数字策略》,网上可阅读全文。这8年间,图书馆数字化发展日新月异,可以作为历史看。

        1990年代,数字化、网络化新型信息大量出现,旧模式已经动摇、新模式尚未形成(But no clear new
paradigm has emerged, even as the old one is
shaken)。1998年,NRC的计算机科学的电信委员会(CSTB)受LC之邀,成立LC信息技术策略委员会,审核该馆信息技术规划与实施状态,以
帮助LC处理面临的严峻形势,并帮助LC完成其使命。委员会的任务不是替LC开药方,而是全面梳理LC的服务与设施。形成的这份报告向LC提出了一些强有
力的告诫。
    报告一开始就针对现状,提出了以下五个当时尚无答案的问题,现在也很难说已经有了答案:
1、西方图书馆的鲜明特点仍将存续吗?
2、公共图书馆仍将广泛及免费地提供保存的信息吗?
3、大型研究图书馆仍将是其选定用户群的信息入口吗?
4、在急于利用互联网的普遍冲击下,数字信息与印刷信息会成功整合,抑或印刷信息将失去其威望?
5、会出现新的知识集成者和组织者(或许出自商业部门),绕过图书馆,找到直接把信息成功交到用户手中的途径吗?

    报告从六个方面对LC进行了分析,并提出建议。现在看来,其中有些是LC在做,有些并未被接受?
1、建设数字馆藏
    包括长期保存、门户模式,接受原生数字资源、与其他系统集成、建立数字资料新标准,寻求修改版权法、收割存档美国网站、建立收集网站政策,收集各类数字资源相关政策(著录与编目、访问、保存)、需要具有高技术能力的专业馆员

2、保存数字遗产

3、组织数字信息访问:从编目到元数据(p.11-12)
   
LC在协调编目标准方面曾经并将继续起着基本作用,这些标准使合作编目成为可能。这种协调应当继续,并且LC应该考虑如何将其作用延伸并转换到互联网环境
下。过去主要在图书馆界内的协作策略已经不够了,因为现在出现了新的重要的利益相关人,如Web搜索公司及联系出版商。
发现:LC大量参与创建与使用元数据,曾长期担当标准建立与初践的领导者。但是,元数据环境演变迅速,这将不但深刻地影响图书馆与其他信息提供者,也影响LC。LC乃至全国,有责任起领导作用,以造福于全国乃至全世界的信息提供者与使用者。
建议:LC应当把开发一个更丰富也更复杂的元数据环境作为一个策略问题,大幅度增加其在这方面的参与及规划,应当更积极地投身于图书馆及信息界在推进元数据实践演变的工作。这需要奉献资源,馆长直接介入制定与调整预期,以及强有力地承诺由LC执委会指定一位项目负责人。
建议:LC应当积极鼓励和参与开发自动创建元数据工具。这些工具应当与编目工作流程整合。

4、LC与世界:跨越围墙
    协作与合作:数字出版与数图研发领域的利益相关人,改进与OCLC及RLG关系,与其他联邦机构(NLM, NAL, NARA, 史密森学会)建立日常高级政策关系

5、管理问题

6、信息技术基础设施

来源
LC21: A Digital Strategy for the Library of Congress / Committee on an
Information Technology Strategy for the Library of Congress, Computer
Science and Telecommunications Board, Commission on Physical Sciences,
Mathematics, and Applications, National Research Council. Washington,
D.C. : National Academy Press, 2000. ISBN 0-309-07144-5
目次:
Executive Summary (1-22)
1. Digital Revolution, Library Evolution (23-49)
2. The Library of Congress: From Jefferson to the Twenty-First Century (50-81) LC从杰弗逊到21世纪
3. Building Digital Collections (82-104)
4. Preserving a Digital Heritage (105-121)
5. Organizing Intellectual Access to Digital Information: From Cataloging to Metadata (122-143)
6. The Library of Congress and the World, Beyond Its Walls (144-162)
7. Management Issues (163-192)
8. Information Technology Infrastructure (193-213)
Afterword (214-216)
Bibliography (217-240)
Appendix A: Biographies of Committee Members (241-252)
Appendix B: Briefers at Plenary Meetings and Site Visits (253-260)
Appendix C: List of Letters Received (261-261)
Appendix D: Acronyms (262-266)

《盛宣怀档案》全文数据库开通

    上半年的时候,在Keven办公室遇Sogg的朋友,来上图查盛宣怀档案未果。因之对上图的盛宣怀档案有了印象,今天看到《文汇读书周报》11月28日头版头条──“盛档”:抹去百年尘封还历史真相──上图的“盛档”数字化已经完成,提供78.7万拍的网上全文查阅系统。研究中国近代史又多了一批丰富的第一手资料。
    与此同时,11月25日到12月8日,“上海图书馆藏盛宣怀档案展”正免费开展。在上图网站的新闻──走近盛宣怀 近代史如此“鲜活”称档案有近16万件、1亿多字,并有多幅彩色扫描件。从外行角度,尽管没有看到编目记录,但只看那几件档案图像,就觉得整理编目者俱是高手,绝对不是看书只看封皮的我等能做的。
    在《文汇读书周报》的报道中,上图副馆长、盛宣怀档案研究中心办公室主任周德明总结全面整理“盛档”的主要意义,包括文献价值、工作方法及学术价值。文献价值、学术价值关注者自然清楚──Sogg的朋友从厦门跑来上海就是一个佐证。从工作方法角度的总结引述如下:对图书馆来讲,“盛档”的整理编目为大型图书馆未编文献整理开发积累了经验,对以后其他图书馆开展类似文献整理提供了可供借鉴的工作方法。
    据《文汇读书周报》报道的数据,整理工作从1997年7月到2005年年底,超过了8年。在此基础上,原件扫描就比较简单了,从2006年9月到2008年8月,共2年。

    上月到上图讲图书馆2.0,最后回答提问阶段,曾斗胆质疑上图秘藏众多宝贝不示人的做法,当时周德明馆长说明是担心资源不能得到合法使用。这个大家都清楚,中国互联网及知识产权保护的现状基本上是“你的就是我的”,拿别人东西卖钱也是普遍现象。如此恶劣生态,阻碍了图书馆资源的开放。不过,当时我说了自己的看法:道高一尺、魔高一丈,只要愿意想办法,总可以解决的。
    目前在上图网站的特色馆藏文献与服务中尚未看到《盛宣怀档案》的介绍,估计是提供局域网浏览?如果暂时无法解决资源保护问题,相信至少“盛档”的目录应该可以提供广域网上的检索、浏览。

[update 2008-12-1] 新华每日电讯2008-11-26:盛宣怀档案在沪对公众开放
    25日,晚清企业界领袖盛宣怀的历史档案在上海图书馆对公众开放展出。同时,拥有近16万件、1亿余字史料的盛宣怀档案,也全部上载上海图书馆局域网,供海内外专家学者浏览查询。

国家数字图书馆标准规范建设

    《数字图书馆论坛》2008年第8期,是为配合9月9日国家图书馆建馆99年、国家图书馆二期暨国家数字图书馆开馆而出的“国家数字图书馆工程专刊”,十篇文章都是宏大叙事。自己感兴趣的是“国家数字图书馆标准规范建设”(赵悦、申晓娟,p.37-42)。

    在做数字化相关工作前,除了都柏林核心,对相关标准几乎一无所知。后来先看网上的“中国数字图书馆标准与规范建设”,再看厚厚一大本的《中国高等教育数字图书馆技术标准与规范》,最后看CADAL的技术规范。基本上到哪个山头唱哪个歌,跟着参与项目的要求走。现在要出现第四个重量级的标准规范了,今后可以挑先前几个项目中没有的规范跟着走了。

3 国家数字图书馆工程标准规范建设规划
3.1 建设目标
(2)立足于国内外已有标准规范成果,为国内其他数字图书馆系统建设提供指导性、示范性规范,并力争使国家数字图书馆工程中采用或研制的成熟标准规范转化为国家标准,从而促进全国数字图书馆建设的标准化进程。
3.2 建设原则
(1)优先选择成熟标准
(2)开放建设原则:全部采用公开招标;成果广泛征求机构及专家意见
(3)核心建设原则
(4)注重应用原则
3.3 建设类型
(1)遵循标准类:ISO 10646(Unicode),GB18030《信息交换用汉字编码字符集基本集的扩充》,OAI-PMH,ISO 15836(DC),MARC等
(2)参考标准类:ISO 14721(OAIS)
(3)待建标准类
(4)修订标准类

4.2 标准规范建设核心内容 / 表1 国家数字图书馆工程标准规范建设项目一览表
项目:汉字处理规范
  汉字属性字典(委托中华书局研制)
  中文文献全文版式还原与全文输入XML规范(委托中易公司研制)
  古籍用字规范(计算机用字标准)(委托中华书局研制)
  计算机中文信息处理规范(委托中易公司研制)
  生僻字、避讳字处理规范(委托中华书局研制)
项目:唯一标识符
  国家图书馆数字资源唯一标识符规范(委托中科院文献情报中心研制)
项目:对象数据
  国家图书馆数字资源对象管理规范
  文本、图像、音频、视频数据加工标准与工作规范
项目:元数据总则
  国家图书馆元数据应用规范
  国家图书馆核心元数据标准
  国家图书馆专门元数据设计规范
  CNMARC XML [期待这个]
  CNMARC-DC-国家图书馆核心元数据集的对照转换  [上图早在2001年就做了CNMARC-DC的对照转换]
  MARC21-DC-国家图书馆核心元数据集的对照转换
项目:专门元数据规范──古文献
  专门元数据标准与著录规范──拓片、舆图、甲骨、古籍、家谱
项目:专门元数据规范──电子书刊
  专门元数据标准与著录规范──电子图书、电子连续性资源、学位论文、期刊论文
项目:专门元数据规范──网络及多媒体资源
  专门元数据标准与著录规范──网络资源、音频、视频、图像
项目:管理元数据
  国家图书馆管理元数据规范
项目:知识组织
  知识组织规范
项目:资源统计
  数字资源统计标准
项目:长期保存
  国家图书馆数字资源长期保存规范

    对于国图标准规范建设的某些方面,CDLS显然有异议。其官方网站首页有2008年5月26日的“《我国数字图书馆标准与规范建设》成果应用要求”,看着耐人寻味:“任何机构在研究或应用中利用本项目成果时,必须保护国家对于本项目成果的完整权利,必须保证不以任何形式将国家拥有和开放获取的本项目成果转移为任何机构或个人专属的成果,必须保证利用本项目成果生成的新成果中所包含的本项目成果内容的国家权属和开放获取,必须保证项目组和项目成果完成作者的合法权益(包括但不限于署名权)。参加本项目研究的任何机构或个人也都无权将本项目成果转让给任何第三方。”

相关链接:
国家图书馆:中国数字图书馆工程(China Digital Library Project)
    [update 2008-10-27] 国家数字图书馆工程标准规范规范质询
《我国数字图书馆标准与规范建设》项目(Chinese Digital Library Standards, CDLS)

 
 
[update 2008-10-27]
国家图书馆数字资源唯一标识符规范公开质询
公开质询时间:2008年10月25日——11月7日
公开质询内容:1.国家图书馆唯一标识符规范
                   2.国家图书馆唯一标识符规范应用指南
国家数字图书馆工程标准规范项目成果公开质询征求意见单