联邦搜索、跨库检索、一站式检索,图书馆在选择软件或应用时,要考虑的因素很多。Deep Web Technologies提出了一个清单,包括联邦搜索的潜在客户考虑及要问厂商的100多个问题(目前为117个),分成十四个大类:
√ 可用性 Usability
√ 架构 Architecture
√ 整合 Integration
√ 搜索功能 Search Features
√ 结果特性 Results Features
√ 软件即服务 SaaS (Software as a Service)
√ 本地主机解决方案 On-site hosting of solution
√ 系统管理 System Administration
√ 连接器 Connectors
√ 提醒 Alerts
√ 支持 Support
√ 强化与升级 Enhancements and Upgrades
√ 计划与部署 Planning and Deployment
√ 厂商信息 Vendor Information
据编制说明,这并不是一个完整的清单,也没有一个厂商可以对所有问题都给予肯定的回答,清单的目的只在于帮助图书馆确定对自己重要的方面。
对图书馆来说,如果向相关厂商抛出这样一份清单,让对方回答所有问题,然后对各家的回复加以汇总分析,确定自己更看重哪些方面的性能,真是可以省很多事。
清单以图书馆方面或者说其技术主管的角度向厂商提问,对厂商以“你们”相称(译文中多省略),对图书馆方面以“我”或“我们”称呼,而“用户”则指读者或最终用户。或许考虑到问题会不断增加,原文并无编号,为方便标识,以下编号为本人所加。
100 Federated Search Requirements Questions To Ask Vendors (DOC文件)
一、可用性 Usability
1、用户界面是否友好及易于使用(即无需用户培训)?
2、基本搜索是否易于执行?
3、是否提供聚类或其他可视化的检索结果?如果是,我是否可以选取自己需要的聚类字段(如作者、日期范围、出版项)
4、是否支持分面(导览)搜索?
5、是否支持分类法及/或本体?
6、高级搜索是否直观?
7、检索结果页是否内容丰富且易于浏览?
8、是否提供基于Web的帮助页面?
9、支持什么浏览器及其版本?
10、搜索支持的最小屏幕分辨率?
二、架构 Architecture
11、用户一次可搜索的最大来源数量?
12、产品可支持多少并发用户/提问?
13、是否所有组件均私有?是否有部分开源?
14、通过一个搜索表单,软件可在什么程度上并行搜索非结构化数据(如论文、白皮书、报告)、基于Web的OPAC目录、公共网站、自建数据库以及订购服务?
15、在不同用户获取不同搜索页与来源时,是否支持不同的访问级别?(这将由Web应用或HTTP服务器支持)
16、能否通过多协议访问文件来源(如XML网关、HTTP、SR/U、SR/W、Z39.50)?
17、是否支持抓屏作为信息提取的最后手段?
18、是否支持用户从不同地点搜索?如果是,支持何种机制(如基于浏览器的代理、代理服务器)?
19、相关排序算法能否以特定日期范围或者某一特定来源,对结果加权?
20、对于搜索与结果中不同形式的日期,处理得如何?
21、对于搜索与结果中不同形式的作者名称,处理得如何(如爱因斯坦的不同形式Einstein, A.对Einstein, Albert对Albert Einstein)?
22、应用的内部工作可定制性如何(如排序、过滤、排序算法)?
23、能否管理个别用户登录到某一来源?
24、能否按每一来源实施并发搜索数限制?
三、整合 Integration
25、是否有API,我可用于将你们的功能嵌入其他软件(如搜索门户)?如果有,说明文件做得如何?
26、是否有你们系统功能的基于标准的Web服务接口?
27、我能否方便地在自己的主页、其他网页及其他应用中方便地嵌入你们应用的搜索框?
28、能否与URL解析器整合?
29、是否与ILS目录整合以浏览期刊或数据库?
30、具有哪些与社会网络和/或协作工具整合的功能?
31、能否与课程管理系统整合(如Moodle或Sakai)?
四、搜索功能 Search Features
32、我们能否选择特定来源搜索,或者选择多组来源搜索?
33、是否实时并行检索多个来源(即是否事实上做联邦搜索)?
34、是否既搜索文摘也搜索全文?
35、是否对不同用户集支持不同搜索页(外观)?
36、具有哪些高级(字段)搜索能力?用户可搜索哪些字段?
37、能否按不同属性执行搜索(如日期或相关性)?
38、是否支持布尔算子、通配符和/或词组搜索?
39、是否支持邻近搜索?
40、用户能否保存搜索供以后执行?
41、用户能否看搜索历史?
42、用户能否定制其搜索体验?
43、是否提供拼写检查,以更正潜在的拼写错误并提供拼写提示?
44、是否提供期刊与数据库的浏览与题名搜索?
45、我能否按日期范围、只搜索同行评议文献、只搜索全文文献作限定搜索?
46、是否以合理方式处理词干与停用词?
47、是否向用户提供数据库描述?
待续:联邦搜索一百问(下)