全球数字图书馆(百万册图书项目)中国站点

    外出一周,今天回家。看博文留言,重又看到了去年12月19日ZZ在“百万图书”项目(CADAL)相关信息下的留言:“整个UDL项目现在是又153万册左右数字图书,其中中国100多万,印度33万,还有埃及的几万。大部分英文图书还没有解决版权问题。中国古籍已经解决。CADAL, ULIB.cn等的关系是, CADAL位于浙大,主要负责中文图书数字化,是ULIB中国南方技术中心,www.cadal.edu.cn也是一个提供比较完整的检索和发布平台,是真的可以实用化的,从这一点讲,CMU的主站都做不到;但CADAL站点主要只有中文图书。而www.ulib.org.cn经过多次改版,已经提供了所有153册图书的镜像检索,涵盖了所有数据,并拥有北方中心15万册英文图书的全文检索系统、插图检索系统和知识网络系统,ulib.org.cn现在可提供所有版权允许的图书的访问。”
    去年11月本馆网站改版后向所有读者介绍CADAL的民国电子书,偶有访问不了的情况发生时,读者比较着急,并且在教育网外,CADAL访问速度极慢,所以想看看介绍中的百万册图书的UDL中国网站,或可与CADAL交替使用。[update: 来自CADAL的消息:因民国文献还有部分处于版权保护期,应作者或权利继承人要求,自2008.7.16起,民国文献全文不对公共网开放服务]

    全球数字图书馆中国站点(http://www.ulib.org.cn/zh-CN/)由中国科学院研究生院主办,看来知者不多。版权日期2003-2008,但至今日的网站访问统计数仅为:
首页访问: 1531
浏览次数: 5850
网站访问: 1101

    首页下有“百万册图书搜索:实验系统”,包括三种检索方式:
· IQuery 2.0 BETA:一种新颖的电子图书检索系统,支持多粒度电子图书检索与多侧面导航。
搜索范围可选择全文、章节、主题、题名或多粒度(all的专业术语?)。
搜索中栏为带图书封面的书目信息摘要;
左栏显示多层主题分面(含命中数):
  Composite subject 主题
  General subfield 一般子类
  People 人物
  Time 时代
  Place 地点
  Form of reservation 体裁
  Source of topic words 主题词来源
  Other subject 其他主题
右栏显示可扩展检索词(按相关度?),且可按可视化方式显示(更改浏览器安全设置后仍没有安装成功)。
· Illustrator:拥有870万张插图超大数据集的语义插图检索系统。
查询速度很快,可惜访问结果都是HTTP Status 404,图像说明都是not available。
· Knowmap:一个基于主题词网络的电子图书可视化导航与检索系统。需要Java插件。

    以上都是研究成果展示(网页下有研发者姓名)。不过因为自己太菜,需要的插件都没有安装成功,所以可视化的部分看不到。不过这没关系,现阶段我只需要最基本的检索功能(ULIB检索),因为我最关心的是能不能看全文,可否以此作为CADAL网站的备用──可惜,好象也不行。
    在帮助页,提示要显示DjVu图像,需从lizardtech下载免费插件 exview_setup.exe(7.9MB);在下载页给出的是其本地提供的DJVU浏览器(DjVuWebBrowserPlugin.exe)。后者与CADAL网站上的一样,本机原已安装,但看不到内容显示;安装前者后,仍看不到页面内容。我使用IE 7.0和Firefox 2.0。
    FAQ中说,如果需要整本下载,可以把书名告知help@ulib.org,然后会得到一个带下载说明的图书链接。这对很多读者来说是个不错的解决方案──不知道是不是真管用?现在假期中,开学后记得一试。

《全球数字图书馆(百万册图书项目)中国站点》上有4条评论

  1. 难怪有些时间没更新,原来是假期外出……您倒是真能赶,在奥运开幕式时回来了

  2. 首页访问: 1531
    浏览次数: 5850
    网站访问: 1101

    太让人吃惊。

  3. 不看好这种官方承办的项目,可用性测试中…
    博主 对 IT小兵 的回复: 2008-08-13 11:26:34
    同一个项目,南方中心浙江大学做得就好很多。觉得北方中心是把这么多电子书当做一个做研究课题的数据库,而不是当作提供公共服务的项目在做。猜想或许没有建立一个稳定的管理机构、投入持续的人力。

  4. 搜索比较寒,用的估计是MySql自带的全文检索,不支持中文的。全字段匹配才能出相要的结果,djvu的plug-in我也装了,可是一本书也没看成…

评论已关闭。