《基于WWW的学术信息检索策略》笔记

      夏立新著《基于WWW的学术信息检索策略》(华中师范大学出版社,2004年6月)

1、我所欣赏的书中所持观点

“资料的筛选成本已经远远大于资料的搜集成本。对于大多数用户来讲,帮助搜集更多资料的意义已越来越小,但帮助精选资料的需求将会越来越强烈。”(34页)
“现代信息技术的发展与完善,特别是人工智能技术的实用程度的提高及其在信息检索领域的应用可能会逐步缩小人工索引方式和自动索引方式之间的差距。”(56页)
[注:可惜所比为”自动索引”即一种利用计算机的受控标引,而非书中所称”基于网络机器人的索引”即关键词索引。]
“检全率作为网络信息检索效果评价的标准需要重新定义”(63页。引自曾民族《网络信息检索现状和性能评价》,情报学报1997年第2期?)
“关键词检索系统像一个’黑箱’,’透明度’很低,只有熟练掌握其检索技巧的用户,才有可能顺利达到检索目的。”(64页)

 

2、书中提出的WWW环境下的检索效果评价标准
      Cleverdon在1966年提出的评价检索系统性能的六条标准:收录范围,响应时间,输出形式,用户负担,查全率,查准率(118页)。本书认为”在WEB环境下,查全率没有实际意义,人们更关心的是‘查准’问题”,故”对上述6条评价标准作如下的修订与补充”(119-121页):

(1)覆盖率与信息质量
“所收录的信息质量,对于网络信息检索工具来说尤为重要。”
(2)查全率和查准率
“明确检索目标,有助于检索查在检索过程中灵活选用不同的检索技术,采用相应的扩检、缩检措施,实现自己的检索目标。”
(3)用户负担
“利用网络信息检索工具,…用户负担主要体现在筛选信息的时间成本。这也从一个方面说明,用户在选择网络信息检索工具时,查准率应该成为一个重点考虑的因素。”
(4)输出形式
输出信息的详略和排序方式。
(5)响应时间

3、关于情报检索语言
      研究信息检索,不可避免涉及检索语言。书中随处可见图书情报界对检索语言较常见的态度,即质疑非受控语言以及使用自然语言的搜索引擎的检索效果。无奈现在网络文献数量太大,非控或后控已是不可阻挡的潮流。而人工智能技术的发展,其实已经在很大程度上改善了关键词检索的效果。
      无论如何,应该采用有说服力的例子证明自己的观点。本书中如此推荐XML置标(127页):

      例如,一位浏览学术出版物的用户使用了检索词”brown”,他可能是查询Donald Brown写的论文,也可能是查询Brown大学出版的论文,还有可能是查询有关棕色熊”brown bear”的论文,他不大可能是同时要查询这三方面的论文。如果他能够确认如下的一种形式:Brown, Brown, 或brown, 那么,他的检索将非常准确。

      用户在检索的时候,难道会只用”brown”,而不是直接用”Donald Brown”或”Brown University”或”brown bear”吗?

      时移世易,若干年前缺乏广泛实用的后控检索系统,我也曾质疑关键词检索效果。二、三年过去了,以作者对现代检索技术的了解,看法是否也会有所改变呢?

 

读《拓展社会的公共信息空间》


     读于良芝、李晓新、王德恒著《拓展社会的公共信息空间――21世纪中国公共图书馆可持续发展模式》(科学出版社,2004),国家哲学社会科学基础项目成果。看完后朋友问我感想,想到的是一句很俗的话:存在的就是合理的。
      作者们在一个完美的研究框架中填充种种无奈的现实,然后再以承认现实的勇气进行多学科分析,试图构建起21世纪中国公共图书馆的可持续发展模式。以前看于良芝的《图书馆学导论》(科学出版社,2003),第一次接触到信息政治经济学,深为该理论对公共图书馆发展史的分析所折服。在本书中,信息政治经济学被大量应用。同时,为弥补信息政治经济学对图书馆未来的悲观预测,又应用图书馆政治学作平衡,以便为公共图书馆构建一个光明的或者说不太黯淡的未来。
      然而看了书中提供的各种信息,我看不到公共图书馆”可持续发展”的未来。昨天刚在网上看到国外有一家公共图书馆被迫关闭。对此,本书作者们早已作了十分符合中国国情的、可操作性的”预言”:

一旦有地区迈出了”闭馆”的一步,并为其他类似地区提供了”闭馆经验”(如闭馆理由陈述、工作人员的安置、文献资源的处置等),就很可能在一些地区出现连锁”闭馆现象”。毕竟,在世界图书馆界,关闭公共图书馆已经不是罕见之举。(p. 30)

      在我想来,拥有更多惨淡信息的作者们应该比我对公共图书馆的前途更感到悲观,然而似乎没有。
      如果我早看此书,就不会奇怪于良芝怎么会研究”三个代表”了。

附《拓展社会的公共信息空间》主要章节目次:

 

第1章  公共图书馆及其环境:信息政治经济学和图书馆政治学分析
第2章  国内外公共图书馆可持续发展现状与对策
第3章  改革开放以来我国公共图书馆发展背景分析
3.1  政治经济
3.2  科学与教育
3.3  文化
3.4  信息技术
3.5  社会生活
第4章  我国公共图书馆可持续发展问题经验分析
4.1  经费问题
4.2  文献资源问题
4.3  人员队伍问题
4.4  用户资源及图书馆利用率问题
4.5  新馆与老馆的可持续发展问题
第5章  公共图书馆的自我发展
5.1  提高绩效与促进发展
5.2  创收与公共图书馆的发展
第6章  公共图书馆的可持续发展与利益权人的支持
第7章  我国公共图书馆可持续发展模式
7.1  公共图书馆可持续发展的管理体制模式
7.2  公共图书馆可持续发展的功能模式
7.3  公共图书馆可持续发展的经济模式

 

国内外数据的比较

    最近在看初景利的博士学位论文《图书馆数字参考咨询服务研究》(北京图书馆出版社,2004)。其中有国内外参考馆员数量调查结果对比:国外9所,参考馆员人数占全部工作人员数量的比例为11.4%,国内19所,为5.6%。由二者相差1倍多得到的结论是:”可见我们对参考咨询还没有给予足够的重视”。
    文中列出的国外数据分布是:10%以下1家,10-20%有3家,20-30%、30-40%各有2家,另有1家为高于50%。看后面3家、尤其是最后1家的数据,似乎高得有点不可思议,不免就胡思乱想一番:
1、真的是占”全部工作人员”的比例?国外图书馆有专业馆员与非专业馆员之分,是不是”占专业人员数量”的比例?
2、国外图书馆还经常雇佣非全日制工作人员,从平均数为11.4%来看,高比例馆的工作人员数量较少,是不是因为其雇佣了较多的临时性员工,未计入工作人员数中?
3、国外经常有从事不同工作的专业馆员同时承担部分参考咨询工作的情况,统计时是不是也计入”参考馆员”人数中了?
4、外包在国外也是非常普遍的现象,这些馆是不是把国内大部分仍由本馆工作人员承担的诸如门岗值班、采编、上架、计算机系统管理等都外包了,以至工作人员数量较少?
    毕竟只是胡思乱想,并无依据。只觉得进行国内外数据对比并不是那么简单的事。

    由此又联想到大家经常进行的国内外比较,国外”如何如何”,为何国内不可”如何如何”。理由可以很简单,情况不同、条件不同――所谓”国情不同”。手上就有一个例子。
    最近几个月CALIS在组织Gale公司几个数据库的试用,登录进去后发现有一个未作介绍的数据库Associations Unlimited,提供全世界的学会、协会及其他非赢利性组织的有关信息。检索到如下数据:
1、美国图书馆协会ALA:有工作人员275名,年预算$49,919,564――他们可以做那么多的事,原来有着雄厚的经济基础。虽然中国图书馆学会在该数据库中没有提供工作人员数量与经费数据,但看看ALA预算的天文数字,不禁为我们的学会叹息。
2、国际图联IFLA,有8名工作人员,年预算EUR 453,780。同样弄得声势颇大的国际图联,经费还不到ALA的1%,可见钱又不是决定一切的。作为该联合会的成员,中图学会是不是该好好学习学习?

    兜了一圈,又回到了起点。套用一句老话,比较不是万能的,没有比较是万万不能的。