电子版民国图书和期刊

    馆里有一些民国书刊,想选择有特色的部分做数字化。因为目的是保护兼使用,以我朴素的想法,尽可能不要与其他图书馆的数字化民国书刊重复。当然如果像Google一样有钱有技术,那就不用考虑,全部数字化了。
    于是到网上去查查有没有公开、半公开的电子版民国书刊,找到了CADAL和国家图书馆两个大户。(update: CADAL信息来自8月参加的CALIS联机编目中心会议和数图研讨班

    CADAL全称“China-American Digital Academic Library”,中文名称“高等学校中英文图书数字化国际合作计划”,从项目网站看,还有俗称“China-US Million Book Digital Library Project”(百万册书数字图书馆项目)。
    首页有输入框可以直接检索,似乎是所有元数据(作者、题名等)的全文检索。进入后可以看到有古籍、民国图书、民国期刊、现代图书、学位论文、绘画、视频和英文几大部分。 可以多选,分栏看各部分检索结果。
    前些天的检索结果,有民国图书181,977册,民国期刊3802种。民国期刊部分CADAL似乎是着眼于完成品种、搭个架子,卷期还缺不少。
    但民国图书部分确实数量很庞大,而且可以全文浏览、逐页保存与打印。相当不错,值得推荐!
    不过它的“详细信息”(书目信息)中没有出版年,是个不足。想来不会是我这个编目员挑剔,读者恐怕对此更挑剔。应该是选择Web显示项目的疏忽,元数据中一般是不会缺出版年这个重要信息的。
    要看正文,需要下载DjVu浏览器插件(DjVuWebBrowserPlugin.exe,15046KB)。

    要看民国期刊,就要到国家图书馆了。从国家图书馆首页“馆藏珍品”,可以进入“民国期刊”:

    “民国中文期刊是国家图书馆保存的民国时期文献之一。为了有效的保护文献、利用文献,国家图书馆早已完成馆藏民国期刊的缩微胶片制作,近年来又开展缩微胶片的数字扫描工作,预计将在三年内完成近600万拍缩微胶片的数字转换。

    民国中文期刊资源库以书目数据、篇名数据、数字对象为内容,提供简单检索、高级检索、二次检索、关联检索和条件限定检索。现提供2000余种期刊电子影像,每期全文前24页的展示浏览。资源库遵循边建设边服务的原则,将不断追加更新资源库内容。”
 
    不知道这“三年”从哪年算起,现在进展程度如何。从检索结果看,那真是个丰富的宝藏,而且我所看到的每期都可以看全部,而不是“全文前24页”。
    虽然上文说国图“早已完成馆藏民国期刊的缩微胶片制作”,但从其馆藏目录检索看,并非全部都做了缩微胶片。如《图书季刊》有印刷版,做了缩微,而《中华图书馆协会会报》并未做缩微。不知未缩微部分民国期刊的数字化计划安排到何时?
    要看正文,需要下载专用阅读器(NLC图书浏览器,NLCReader.exe,8790KB)。

    昨天咨询值班,遇到一位读者想知道哪里有1901年的《教育世界》(期刊)。查国图只有1905-1907年,未缩微,也未数字化。查CADAL的古籍与民国期刊,也都没有。后来查到北师大有1901-1903, no.1-68。介绍云:“我国创办最早,发行量较大,出版时间较长,影响较大的教育专业杂志。”
    想到这些1911年前的非线装图书与期刊,很有价值,但既不属民国、也非一般意义上的古籍,在数字化时,是否会成为被遗忘的角落?

数图研讨班之五:博客报道

说明:此为“数图研讨班”系列最后一篇,收录的博客报道将更新到本月底。
[2006-9-16说明:此文更新版在博客网丢失,根据备份原博文恢复]

数图研究

数图高研班的主题 http://my.donews.com/keven/2006/08/07/
[对2004-2006年三届研讨班主题,按问题领域的归类表,有助于直观了解数字图书馆问题的全局?]

清华归来
 http://my.donews.com/keven/2006/08/16/gwsmqewwwztioibyabzqrximvwtsuntjrumv/[对2006届研讨班的分析,“十大收获”可谓面面俱到,又很到点]

我的讲稿:讲不完的beta版
http://my.donews.com/keven/2006/08/16/vbsnhzmatnrugchpvfmloockdjbhywxuqgvm/

关于Lib2.0的文章http://my.donews.com/keven/2006/08/18/
[“Web2.0技术图书馆应用分析”原文链接及说明,上述讲稿的补充]

图谋博客相关系列选:

我看2006年数字图书馆前沿问题高级研讨班
http://libseeker.blogchina.com/5484850.html

走近DL前沿问题高级研讨班访谈结果http://libseeker.blogchina.com/5490094.html
[对本次研讨班专家的电邮访谈,有助于了解研讨班的背景]

图书馆2.0与图书馆信息技术部的建设http://libseeker.blogchina.com/5542495.html
[a在研讨会上的发言]

DL研讨班之我见 http://libseeker.blogchina.com/5544294.html

一思不狗相关报道选(部分为现场报道):

数字图书馆前沿问题高级研讨班:(1)热身http://fandog.xmu.edu.cn/archives/328
[会前的一些资料链接]

数字图书馆前沿问题高级研讨班:(6)花絮 a
http://fandog.xmu.edu.cn/archives/338
[孙卫、孙坦对用户意见的看法]

数字图书馆前沿问题高级研讨班:(8)记录 b
http://fandog.xmu.edu.cn/archives/343
[对keven和曾蕾报告的评介,以及8月14日会议简报]

闲来无空:

数字图书馆前沿问题高级研讨班:(6)会议记录之E-Science条件下的数字图书馆建设—CSDL的实践与规划http://www.sogg.name/archives/200608/14_653.html
[孙坦关于国家科学数字图书馆的这个报告,与keven的数字图书馆2.0一样前卫。还有很多相关链接]

毁人不倦:

数图研讨班感想--让人出神的技术
http://blog.xmulib.org/oceansky/2006/08/post_1.html

数图研讨班调查问卷
http://blog.xmulib.org/oceansky/2006/08/post_29.html

编目精灵:

数图研讨班之一:随感 http://catwizard.blogchina.com/5545336.html
数图研讨班之二:布道者 http://catwizard.blogchina.com/5546341.html
数图研讨班之三:以用户为中心的数字图书馆门户 http://catwizard.blogchina.com/5546755.html
数图研讨班之四:可视化(Visualization)http://catwizard.blogchina.com/5550048.html
数图研讨班之五:博客报道http://catwizard.blogchina.com/5550134.html

附相关链接:
2006数字图书馆前沿问题高级研讨班http://elib.lib.tsinghua.edu.cn:8080/meeting/
[设有多个版块,如会议日程、主题报告人、资料下载、相关链接等。“资料下载”部分尚未更新,应该会有PPT、视频等资料,请耐心等待]

数字图书馆前沿问题高级研讨班 (http://www.dl-china.org/)
[研讨班的博客,有至今为止三届研讨班的网址链接等信息;可用RSS订阅http://www.dl-china.org/?feed=rss2]

數位圖書館發展國際研討會http://libraryviews.blogsome.com/2006/08/14/388/
8月10-11日,本次研讨班的几位美国专家在臺灣大學圖書資訊學系主办的「數位圖書館發展」國際研討會
http://www.lis.ntu.edu.tw/main/news_chinese.php?kind=2&Cat=1&I=752(讲义下载/http://www.lis.ntu.edu.tw/form/ddl2006.rar)

数图研讨班之四:可视化(Visualization)

     五月份在上图举办的“Web2.0与信息服务”会议中讲“新型OPAC系统:功能与样例”时,曾举过AquaBrowser的例子,归类在“分面浏览与导航”。这次数字图书馆前沿问题高级研讨班上,林夏讲“信息可视化与可视分析”,其中也有这个例子。因为想了解一些可视化的产生方法及工具,所以最后的分组讨论选择了参加“可视化及医学图书馆”小组。
     因为林夏得到了由MeSH词表分析的医学文献数据,希望国内医学图书馆能够参与可视化应用(本人对此完全不了解,所以可能理解有误)。在场有一些医学图书馆同仁,但没有表示出足够的兴趣。如果看到此处有感兴趣的,可以直接与林夏联系,相信他会很高兴的。

     撇开医学图书馆的论题,讨论中提到以下一些“可视化”相关议题:

  • 是不是可以做图书馆书目、流通方面信息的可视化?
    答:自然是可以的,目的呢?
  • 图书馆购买数据库间收录期刊重复是很严重的现象,而数据库价格长涨更是看不到尽头。是不是可以用可视化方法,分析图书馆购买的数据库,包括数据库之间的重复度,以及同一数据库收录期刊各年的差异?
  • 不管原始数据以何种形式保存,只要转出成XML格式,就可以分析,所以可视化相关的分析软件通用性很强。

     林夏在他的PPT中举了很多实例,在去年研讨班的PPT中还有另外一些例子。他认为可视化及可视化分析发展很快,过几年就会很流行的。
     “读图时代”,枯燥的数据也变成图示,自然会很令人愉快。所以我相信林夏所说的发展趋势,再举几个自己所知的可视化例子:

     林夏说,《图书馆高技术》(Library Hi Tech) 将出版“可视化在图书馆应用”的专辑(九月截稿,估计要到明年出版)。等待看到更多图书馆应用的实例,对于搞技术的,应该更想看到实例的实现方法。

链接:
Library Views 图书馆观点:数位图书馆发展国际研讨会
Ted介绍了本次研讨班的几位专家在台湾大学“数位图书馆发展”国际研讨会上的报告,特别介绍了林夏的“资讯视觉化”(IV, Information Visualization)。
两岸在专业术语上的差距还真是不小。