《基于WWW的学术信息检索策略》点滴

      看完了夏立新著《基于WWW的学术信息检索策略》(华中师范大学出版社,2004年6月)。上次作“笔记”,勉强可算”先是讲好”,这次作”点滴”,写对全书的整体看法,算是”再讲不足”。

1、遗憾。本书根据作者2002年5月通过答辩的博士学位论文”稍作修改而成”(后记),在写成两年多后才出版,而自己在出版半年后才看。因为该书资料大抵是在2001年收集,所引专著和期刊论文基本上发表于1990年代。在网络发展日新月异的今日,很多信息陈旧也是无可奈何的事了。可以作为世纪之交网络学术信息检索状况的一个历史记录(?)。
2、教科书。作为博士学位论文,除了系统总结现状之外,应该有更多的本人研究成果。但本书很多地方都象是入门读物,而不是研究专著。最有意思的是,书中居然用3页多纸的篇幅介绍一款桌面软件安装、使用的操作步骤(114-117页)。
3、作者的清醒认识。”结束语”中的自评显示了作者对本书的清醒认识,而不能视为谦虚或客套。这是本书的一个亮点――绝非讥讽之言,因为作者指出了他所认识到的本主题应当研究而在书中又未能实现的内容,从而显示了一位博士所具备的素质。

 

《基于WWW的学术信息检索策略》笔记

      夏立新著《基于WWW的学术信息检索策略》(华中师范大学出版社,2004年6月)

1、我所欣赏的书中所持观点

“资料的筛选成本已经远远大于资料的搜集成本。对于大多数用户来讲,帮助搜集更多资料的意义已越来越小,但帮助精选资料的需求将会越来越强烈。”(34页)
“现代信息技术的发展与完善,特别是人工智能技术的实用程度的提高及其在信息检索领域的应用可能会逐步缩小人工索引方式和自动索引方式之间的差距。”(56页)
[注:可惜所比为”自动索引”即一种利用计算机的受控标引,而非书中所称”基于网络机器人的索引”即关键词索引。]
“检全率作为网络信息检索效果评价的标准需要重新定义”(63页。引自曾民族《网络信息检索现状和性能评价》,情报学报1997年第2期?)
“关键词检索系统像一个’黑箱’,’透明度’很低,只有熟练掌握其检索技巧的用户,才有可能顺利达到检索目的。”(64页)

 

2、书中提出的WWW环境下的检索效果评价标准
      Cleverdon在1966年提出的评价检索系统性能的六条标准:收录范围,响应时间,输出形式,用户负担,查全率,查准率(118页)。本书认为”在WEB环境下,查全率没有实际意义,人们更关心的是‘查准’问题”,故”对上述6条评价标准作如下的修订与补充”(119-121页):

(1)覆盖率与信息质量
“所收录的信息质量,对于网络信息检索工具来说尤为重要。”
(2)查全率和查准率
“明确检索目标,有助于检索查在检索过程中灵活选用不同的检索技术,采用相应的扩检、缩检措施,实现自己的检索目标。”
(3)用户负担
“利用网络信息检索工具,…用户负担主要体现在筛选信息的时间成本。这也从一个方面说明,用户在选择网络信息检索工具时,查准率应该成为一个重点考虑的因素。”
(4)输出形式
输出信息的详略和排序方式。
(5)响应时间

3、关于情报检索语言
      研究信息检索,不可避免涉及检索语言。书中随处可见图书情报界对检索语言较常见的态度,即质疑非受控语言以及使用自然语言的搜索引擎的检索效果。无奈现在网络文献数量太大,非控或后控已是不可阻挡的潮流。而人工智能技术的发展,其实已经在很大程度上改善了关键词检索的效果。
      无论如何,应该采用有说服力的例子证明自己的观点。本书中如此推荐XML置标(127页):

      例如,一位浏览学术出版物的用户使用了检索词”brown”,他可能是查询Donald Brown写的论文,也可能是查询Brown大学出版的论文,还有可能是查询有关棕色熊”brown bear”的论文,他不大可能是同时要查询这三方面的论文。如果他能够确认如下的一种形式:Brown, Brown, 或brown, 那么,他的检索将非常准确。

      用户在检索的时候,难道会只用”brown”,而不是直接用”Donald Brown”或”Brown University”或”brown bear”吗?

      时移世易,若干年前缺乏广泛实用的后控检索系统,我也曾质疑关键词检索效果。二、三年过去了,以作者对现代检索技术的了解,看法是否也会有所改变呢?

 

读《拓展社会的公共信息空间》


     读于良芝、李晓新、王德恒著《拓展社会的公共信息空间――21世纪中国公共图书馆可持续发展模式》(科学出版社,2004),国家哲学社会科学基础项目成果。看完后朋友问我感想,想到的是一句很俗的话:存在的就是合理的。
      作者们在一个完美的研究框架中填充种种无奈的现实,然后再以承认现实的勇气进行多学科分析,试图构建起21世纪中国公共图书馆的可持续发展模式。以前看于良芝的《图书馆学导论》(科学出版社,2003),第一次接触到信息政治经济学,深为该理论对公共图书馆发展史的分析所折服。在本书中,信息政治经济学被大量应用。同时,为弥补信息政治经济学对图书馆未来的悲观预测,又应用图书馆政治学作平衡,以便为公共图书馆构建一个光明的或者说不太黯淡的未来。
      然而看了书中提供的各种信息,我看不到公共图书馆”可持续发展”的未来。昨天刚在网上看到国外有一家公共图书馆被迫关闭。对此,本书作者们早已作了十分符合中国国情的、可操作性的”预言”:

一旦有地区迈出了”闭馆”的一步,并为其他类似地区提供了”闭馆经验”(如闭馆理由陈述、工作人员的安置、文献资源的处置等),就很可能在一些地区出现连锁”闭馆现象”。毕竟,在世界图书馆界,关闭公共图书馆已经不是罕见之举。(p. 30)

      在我想来,拥有更多惨淡信息的作者们应该比我对公共图书馆的前途更感到悲观,然而似乎没有。
      如果我早看此书,就不会奇怪于良芝怎么会研究”三个代表”了。

附《拓展社会的公共信息空间》主要章节目次:

 

第1章  公共图书馆及其环境:信息政治经济学和图书馆政治学分析
第2章  国内外公共图书馆可持续发展现状与对策
第3章  改革开放以来我国公共图书馆发展背景分析
3.1  政治经济
3.2  科学与教育
3.3  文化
3.4  信息技术
3.5  社会生活
第4章  我国公共图书馆可持续发展问题经验分析
4.1  经费问题
4.2  文献资源问题
4.3  人员队伍问题
4.4  用户资源及图书馆利用率问题
4.5  新馆与老馆的可持续发展问题
第5章  公共图书馆的自我发展
5.1  提高绩效与促进发展
5.2  创收与公共图书馆的发展
第6章  公共图书馆的可持续发展与利益权人的支持
第7章  我国公共图书馆可持续发展模式
7.1  公共图书馆可持续发展的管理体制模式
7.2  公共图书馆可持续发展的功能模式
7.3  公共图书馆可持续发展的经济模式