联邦搜索一百问(上)

    联邦搜索、跨库检索、一站式检索,图书馆在选择软件或应用时,要考虑的因素很多。Deep Web Technologies提出了一个清单,包括联邦搜索的潜在客户考虑及要问厂商的100多个问题(目前为117个),分成十四个大类:
    √ 可用性 Usability
    √ 架构 Architecture
    √ 整合 Integration
    √ 搜索功能 Search Features
    √ 结果特性 Results Features
    √ 软件即服务 SaaS (Software as a Service)
    √ 本地主机解决方案 On-site hosting of solution
    √ 系统管理 System Administration
    √ 连接器 Connectors
    √ 提醒 Alerts
    √ 支持 Support
    √ 强化与升级 Enhancements and Upgrades
    √ 计划与部署 Planning and Deployment
    √ 厂商信息 Vendor Information

    据编制说明,这并不是一个完整的清单,也没有一个厂商可以对所有问题都给予肯定的回答,清单的目的只在于帮助图书馆确定对自己重要的方面。
    对图书馆来说,如果向相关厂商抛出这样一份清单,让对方回答所有问题,然后对各家的回复加以汇总分析,确定自己更看重哪些方面的性能,真是可以省很多事。
    清单以图书馆方面或者说其技术主管的角度向厂商提问,对厂商以“你们”相称(译文中多省略),对图书馆方面以“我”或“我们”称呼,而“用户”则指读者或最终用户。或许考虑到问题会不断增加,原文并无编号,为方便标识,以下编号为本人所加。

100 Federated Search Requirements Questions To Ask Vendors (DOC文件)

一、可用性 Usability
1、用户界面是否友好及易于使用(即无需用户培训)?
2、基本搜索是否易于执行?
3、是否提供聚类或其他可视化的检索结果?如果是,我是否可以选取自己需要的聚类字段(如作者、日期范围、出版项)
4、是否支持分面(导览)搜索?
5、是否支持分类法及/或本体?
6、高级搜索是否直观?
7、检索结果页是否内容丰富且易于浏览?
8、是否提供基于Web的帮助页面?
9、支持什么浏览器及其版本?
10、搜索支持的最小屏幕分辨率?

二、架构 Architecture
11、用户一次可搜索的最大来源数量?
12、产品可支持多少并发用户/提问?
13、是否所有组件均私有?是否有部分开源?
14、通过一个搜索表单,软件可在什么程度上并行搜索非结构化数据(如论文、白皮书、报告)、基于Web的OPAC目录、公共网站、自建数据库以及订购服务?
15、在不同用户获取不同搜索页与来源时,是否支持不同的访问级别?(这将由Web应用或HTTP服务器支持)
16、能否通过多协议访问文件来源(如XML网关、HTTP、SR/U、SR/W、Z39.50)?
17、是否支持抓屏作为信息提取的最后手段?
18、是否支持用户从不同地点搜索?如果是,支持何种机制(如基于浏览器的代理、代理服务器)?
19、相关排序算法能否以特定日期范围或者某一特定来源,对结果加权?
20、对于搜索与结果中不同形式的日期,处理得如何?
21、对于搜索与结果中不同形式的作者名称,处理得如何(如爱因斯坦的不同形式Einstein, A.对Einstein, Albert对Albert Einstein)?
22、应用的内部工作可定制性如何(如排序、过滤、排序算法)?
23、能否管理个别用户登录到某一来源?
24、能否按每一来源实施并发搜索数限制?

三、整合 Integration
25、是否有API,我可用于将你们的功能嵌入其他软件(如搜索门户)?如果有,说明文件做得如何?
26、是否有你们系统功能的基于标准的Web服务接口?
27、我能否方便地在自己的主页、其他网页及其他应用中方便地嵌入你们应用的搜索框?
28、能否与URL解析器整合?
29、是否与ILS目录整合以浏览期刊或数据库?
30、具有哪些与社会网络和/或协作工具整合的功能?
31、能否与课程管理系统整合(如Moodle或Sakai)?

四、搜索功能 Search Features
32、我们能否选择特定来源搜索,或者选择多组来源搜索?
33、是否实时并行检索多个来源(即是否事实上做联邦搜索)?
34、是否既搜索文摘也搜索全文?
35、是否对不同用户集支持不同搜索页(外观)?
36、具有哪些高级(字段)搜索能力?用户可搜索哪些字段?
37、能否按不同属性执行搜索(如日期或相关性)?
38、是否支持布尔算子、通配符和/或词组搜索?
39、是否支持邻近搜索?
40、用户能否保存搜索供以后执行?
41、用户能否看搜索历史?
42、用户能否定制其搜索体验?
43、是否提供拼写检查,以更正潜在的拼写错误并提供拼写提示?
44、是否提供期刊与数据库的浏览与题名搜索?
45、我能否按日期范围、只搜索同行评议文献、只搜索全文文献作限定搜索?
46、是否以合理方式处理词干与停用词?
47、是否向用户提供数据库描述?

待续:联邦搜索一百问(下)

Intute网络技能在线培训课程

   Intute收录由图书馆员选择和评价的高质量教育和研究方面的网络资源,分科学技术、艺术人文、社会科学、健康与生命科学四大类,每类下再分小类,提供免费的浏览与检索。intute由联合信息委员会(Joint Information Systems Committee, JISC)资助,由英国七所大学所组成的联盟负责建设。
    从理念上讲,图书馆员们相信经人工选择与评价的网络资源优于搜索引擎的电脑排序算法,所以明知不可为而为之,在Google机器人尤无法爬遍的海量网络资源中精心选择高质量的网站,并且持之以恒(偶见一条的更新信息为2008年3月)。
    即使我不是图书馆员,我仍会相信由这样的网站(或曰资源发现门户)开始从事研究是很适合的,如同图书馆学网络资源入门宜从图书馆员因特网图书馆(INTERNET LIBRARY FOR LIBRARIANS)开始。

    除此之外,Intute提供一套不同专题的虚拟培训课程(Virtual Training Suite),是互联网教育与研究技能的免费在线培训课程,共有60多个专题,这些专题有的针对高校学生,有的针对成人学习者。高校图书馆如做面向学生的主题研究指南信息素养教育在线课程设计等,均值得参考。

   各专题课程结构相同,分四个部分,认真看完要1-2小时──当然不必一次完成,更可以跳着看:

    由TOUR介绍该专题最佳网站入手(自然侧重英国及欧洲网站),通过DISCOVER做专门搜索工具的实际操作(TRY IT),以及与通用搜索引擎的对比,强化学习者对专门搜索工具(主要是intute)的印象。随后就是图书馆员最为自豪的JUDGE,对资源质量的判断主要看3W──Who、Where、When,还可以从URL构成判断质量。SUCCESS若干取自网络的成功故事做示范,并提供更多相关网站。
    除了内容,课程设计得很细致:为不了解课程中涉及的IT用语者准备了词汇表(Glossary);各部分穿插小测试(QUIZ);课程中涉及的网站后有ADD按钮,可点击加入“链接篮”(Links basket)随时细看,并可加上点评、发送到自己的邮箱中;还可打印(Print)出美观的文本。

    课后有一个反馈,其中一个问题是“你最喜欢课程的什么”,我的回答是链接篮。作为一门研究入门课,还是比较枯燥的,并且其内容不可能在一二小时内就完全掌握,留下重要的资源以后参考、重要的信息慢慢消化,是十分必要的。

附:百度百科的intute词条
intute是英国七所大学合作构建的网络资源发现门户(RDN)整合了Altis、Artifact、BIOME、EEVL、GEsource、 Humbul、PSIgate、SOSIG八个非常有名的学科信息资源门户,分为科学技术、人文艺术、社会科学、健康与生命科学四个服务模块,提供由学科馆员选择和评价的高质量教育和研究方面的网络资源(英文)。
这是英国的一项免费为讲师、研究人员和学生们提供发现和获取高质量网络资源的国内服务,它以提供最高效的因特网资源来支持教育与科研活动。
由曼彻斯特大学的MIMAS牵头,由众多的合伙人和提供方共同协作的,整个组织的核心是一个包括七所大学在内的协会,汇聚了大量的丰富经验与专业知识。
Intute的资金来自JISC,同时受到艺术与人文研究委员会(AHRC)以及经济与社会研究委员会(ESRC)的协助。
网址为:http://www.intute.ac.uk/

在上海如何找餐馆

大众点评网(http://www.dianping.com)
网站自我介绍:“城市消费指南:餐馆美食、购物、休闲娱乐、生活服务、活动优惠打折信息。大众点评网是中国第一家也是最大的web2.0式的本地搜索门户。商户的信息和评价全部由会员共同管理和维护。”

    自在Keven处磳饭若干次后,也跟着习惯上大众点评网查餐馆信息,还注册了会员。选餐馆、尤其是点菜时由会员点评中得益良多,因而也常贡献一些自己的点评。找餐馆首选。
    收到《上海餐馆指南》,说明有短信查询(每条1元):发送ADP+内容(餐馆名称、商圈等)到106695883。

咕嘟妈咪(http://www.gudumami.cn)
网站自我介绍:“餐饮搜索网站“咕嘟妈咪”。按菜系,优惠券类别,商场公园等生活场所周边,餐厅卖点,人气地带周边,用餐 目的,区域,交通站点周边以及关键字等,简便快捷的搜索餐饮店。全部免费!各种优惠券和最新的餐饮店信息应有尽有。咕嘟妈咪-上海最精彩的餐饮搜索网站。”

    某次在网上查到已订好位的那家餐馆有咕嘟妈咪优惠券,打印好带着,省了不少银子。其实我们常常多花了钱而不自知呢。
    有些餐馆页面还有详细的菜单信息,比如这家,可以参考。和点评网比着看比较好。

雅虎口碑网(http://shanghai.koubei.com)
网站自我介绍:“口碑网上海餐饮休闲频道为用户提供上海餐饮休闲城市消费指南。上海的餐馆美食、休闲娱乐店铺信息,品客点评、地图、菜肴图片、优惠活动、打折信息;”

    界面看上去和大众点评网太像了,不同之处是在各店有“周边信息”链接,可以选择找周边1、2、3、5公里范围内的餐馆。大多数找餐馆的网站都有按地区浏览功能,但每区只提供有限的几处,口碑网的“周边信息”就可以做到更精确的定位。

订餐小秘书(http://www.57575777.com)
网站自我介绍:“上海最大最全的餐饮指南:上海唯一一家提供360度环视的餐饮,饭店搜索引擎,给您身临其境的现场感。提供全上海饭店的最新信息。配套免费热线57575777提供一站式订餐服务,一个电话,订遍上海饭店。超过300家中高档饭店现场优惠折扣,就餐奉送兑奖积分。”

    有时想好去某家餐厅,找到后发现与想像中差别很大。可以试试在“我吃我吃我吃吃吃”有没有360度视频,可以看餐馆内景。还有菜式介绍,广告性比较强。

请客800网(http://pindao.qingke800.com/sh/)
网站自我介绍:“请客800网是一家领先的精品餐饮、休闲娱乐预订平台。提供精品餐饮、沐浴休闲、夜总会、歌舞厅、量贩式ktv、茶楼等娱乐场所的打折信息和预订服务,预订电话4007-066-800!”

    似乎唯一可取的就是也有网友评论可供参考。可是现在大家不都在做网友点评吗?