联邦搜索一百问(下)

续:联邦搜索一百问(上)

五、结果特性 Results Features
48、是否提供相关性排序?如果是,如何做的?
49、是否对结果排重?如果是,针对什么字段做排重?
50、是否合并不同来源的多个结果,以产生包含所有来源结果的单一结果页?
51、对单个来源,软件能检索到多少结果?
52、是否提供增量(部分)结果,让用户可以立刻看到部分结果,无须等待所有来源返回所有结果?
53、系统能否对检索结果显示哪些字段提供灵活的处理?
54、能以什么方式排序结果?
55、是否支持结果过滤(缩检)?
56、能否标记搜索结果以下载、保存或打印?
57、结果一览表能否通过电子邮件发送?如果能,能否以HTML或文本方式发送?
58、搜索结果能否输出为RSS种子?
59、能否输出为引文?如果能,以什么格式?
60、用户能否按内容类型组织结果(如视频、演示、培训课程、新闻)?

六、软件即服务 SaaS (Software as a Service)
61、费用结构?按用户数、连接器数或是其他方式收费?
62、我必须签多长时间的合同?
63、是否实施负载平衡(load balancing)?
64、服务是否具有高可用性(如容错)?
65、你们为你们的搜索引擎与连接器配备什么样的实地监测?

七、本地主机解决方案 On-site hosting of solution
66、硬件要求(CPU、内存、存储)?
67、软件运行于什么平台?
68、安装软件的技术要求?
69、维护软件需要什么级别的技术资源(时间与能力)?
70、维护软件需要什么级别的管理支持(时间与能力)?
71、费用结构(如许可条款)?
72、软件维护和错误修复的模式?

八、系统管理 System Administration
73、有什么性能和/或其他指标可用(如用户提问数、特定来源返回文献数、来源性能、搜索词)?
74、提供哪些工具监测本地主机系统的组件(如CPU、内存、进程使用)
75、提供什么创建与管理用户的管理工具
76、能否让来源离线与连线?(如在来源临时宕机的情况下,能够让连接失效是很有用的)

九、连接器 Connectors
77、是否有远程监测连接器的机制?如何处理远程确认的连接器问题?
78、是否有可让我使用的监测连接器的工具,可在某个连接器不再工作时得到通知?
79、能否向我提供可用连接器的清单?
80、在搜索信息源时,是否处理进程(sessions)与cookies?
81、我能否创建自己的连接器?如果能,创建是否很困难?你们为此提供什么工具、培训、文件及支持?
82、能否搜索具有索引文件的应用?
83、是否为链接解析器整合ILS目录?
84、软件能否对某一来源自动检索更多的结果(即得到下一页结果)?
85、你们如何对我的内部来源[自建数据库]维护连接器?
86、你们是否对我的“必须拥有”清单有(或者承诺建立)连接器?
87、你们处理新连接器的过程是什么?需要多长时间建立?
88、能否搜索本地ILS目录?
89、我能否使用你们的应用搜索自己的企业级应用(如Documentum, Lotus Domino, MS Exchange)?
90、对搜索订购来源,支持什么认证机制(如用户名/口令登录,IP认证)?

十、提醒 Alerts
91、用户能否创建提醒,定期收到新的搜索结果?
92、我能否由刚执行的搜索的搜索结果清单页,自动创建提醒?
93、我如何获知新的搜索结果(如电子邮件或RSS)?

十一、支持 Support
94、你们如何处理出错报告并解决问题?
95、你们的服务级别协议?
96、你们以什么方式处理支持服务(如电话、电子邮件、联机)?是否提供实时电话支持?
97、你们是否提供来自我们用户的支持服务?
98、如何为支持付账?
99、你们需要多少时间修复受损连接器?
100、你们提供什么文档?
101、如果需要,你们是否提供用户培训?
102、你们向系统管理员提供什么文档和/或培训?

十二、强化与升级 Enhancements and Upgrades
103、你们如何处理新功能发布?
104、升级是否免费?
105、升级如何安装?
106、你们多久部署一次升级?

十三、计划与部署 Planning and Deployment
107、一旦签订合同,你们多久能完成部署?
108、你们是否有为客户准备的营销资料?
109、应用的外观和风格可定制性如何,即我能否方便地加上自己的标识?
110、我能否创建预先确定的主题范畴,以便按主题对资源分组并进行搜索?
111、我能否方便地生成自己的搜索页,在其中预先确定显示哪些资源及搜索字段?用户能否做同样的事?管理员呢?(为一门课程创建一个搜索页的人或许需要这项功能)
112、你们能提供什么演示,尤其是与我情况类似客户的演示?能否由我自己操作该演示?能否在演示中包含某些我所关注的来源?
113、你们是否创建领航?
114、你们能否帮助计算我的投资回报率?

十四、厂商信息 Vendor Information
115、公司业务开展多久了?
116、你们专长于何种联邦搜索环境?
117、能否提供有相似需求与条件的客户供参考?

联邦搜索一百问(上)

    联邦搜索、跨库检索、一站式检索,图书馆在选择软件或应用时,要考虑的因素很多。Deep Web Technologies提出了一个清单,包括联邦搜索的潜在客户考虑及要问厂商的100多个问题(目前为117个),分成十四个大类:
    √ 可用性 Usability
    √ 架构 Architecture
    √ 整合 Integration
    √ 搜索功能 Search Features
    √ 结果特性 Results Features
    √ 软件即服务 SaaS (Software as a Service)
    √ 本地主机解决方案 On-site hosting of solution
    √ 系统管理 System Administration
    √ 连接器 Connectors
    √ 提醒 Alerts
    √ 支持 Support
    √ 强化与升级 Enhancements and Upgrades
    √ 计划与部署 Planning and Deployment
    √ 厂商信息 Vendor Information

    据编制说明,这并不是一个完整的清单,也没有一个厂商可以对所有问题都给予肯定的回答,清单的目的只在于帮助图书馆确定对自己重要的方面。
    对图书馆来说,如果向相关厂商抛出这样一份清单,让对方回答所有问题,然后对各家的回复加以汇总分析,确定自己更看重哪些方面的性能,真是可以省很多事。
    清单以图书馆方面或者说其技术主管的角度向厂商提问,对厂商以“你们”相称(译文中多省略),对图书馆方面以“我”或“我们”称呼,而“用户”则指读者或最终用户。或许考虑到问题会不断增加,原文并无编号,为方便标识,以下编号为本人所加。

100 Federated Search Requirements Questions To Ask Vendors (DOC文件)

一、可用性 Usability
1、用户界面是否友好及易于使用(即无需用户培训)?
2、基本搜索是否易于执行?
3、是否提供聚类或其他可视化的检索结果?如果是,我是否可以选取自己需要的聚类字段(如作者、日期范围、出版项)
4、是否支持分面(导览)搜索?
5、是否支持分类法及/或本体?
6、高级搜索是否直观?
7、检索结果页是否内容丰富且易于浏览?
8、是否提供基于Web的帮助页面?
9、支持什么浏览器及其版本?
10、搜索支持的最小屏幕分辨率?

二、架构 Architecture
11、用户一次可搜索的最大来源数量?
12、产品可支持多少并发用户/提问?
13、是否所有组件均私有?是否有部分开源?
14、通过一个搜索表单,软件可在什么程度上并行搜索非结构化数据(如论文、白皮书、报告)、基于Web的OPAC目录、公共网站、自建数据库以及订购服务?
15、在不同用户获取不同搜索页与来源时,是否支持不同的访问级别?(这将由Web应用或HTTP服务器支持)
16、能否通过多协议访问文件来源(如XML网关、HTTP、SR/U、SR/W、Z39.50)?
17、是否支持抓屏作为信息提取的最后手段?
18、是否支持用户从不同地点搜索?如果是,支持何种机制(如基于浏览器的代理、代理服务器)?
19、相关排序算法能否以特定日期范围或者某一特定来源,对结果加权?
20、对于搜索与结果中不同形式的日期,处理得如何?
21、对于搜索与结果中不同形式的作者名称,处理得如何(如爱因斯坦的不同形式Einstein, A.对Einstein, Albert对Albert Einstein)?
22、应用的内部工作可定制性如何(如排序、过滤、排序算法)?
23、能否管理个别用户登录到某一来源?
24、能否按每一来源实施并发搜索数限制?

三、整合 Integration
25、是否有API,我可用于将你们的功能嵌入其他软件(如搜索门户)?如果有,说明文件做得如何?
26、是否有你们系统功能的基于标准的Web服务接口?
27、我能否方便地在自己的主页、其他网页及其他应用中方便地嵌入你们应用的搜索框?
28、能否与URL解析器整合?
29、是否与ILS目录整合以浏览期刊或数据库?
30、具有哪些与社会网络和/或协作工具整合的功能?
31、能否与课程管理系统整合(如Moodle或Sakai)?

四、搜索功能 Search Features
32、我们能否选择特定来源搜索,或者选择多组来源搜索?
33、是否实时并行检索多个来源(即是否事实上做联邦搜索)?
34、是否既搜索文摘也搜索全文?
35、是否对不同用户集支持不同搜索页(外观)?
36、具有哪些高级(字段)搜索能力?用户可搜索哪些字段?
37、能否按不同属性执行搜索(如日期或相关性)?
38、是否支持布尔算子、通配符和/或词组搜索?
39、是否支持邻近搜索?
40、用户能否保存搜索供以后执行?
41、用户能否看搜索历史?
42、用户能否定制其搜索体验?
43、是否提供拼写检查,以更正潜在的拼写错误并提供拼写提示?
44、是否提供期刊与数据库的浏览与题名搜索?
45、我能否按日期范围、只搜索同行评议文献、只搜索全文文献作限定搜索?
46、是否以合理方式处理词干与停用词?
47、是否向用户提供数据库描述?

待续:联邦搜索一百问(下)

Intute网络技能在线培训课程

   Intute收录由图书馆员选择和评价的高质量教育和研究方面的网络资源,分科学技术、艺术人文、社会科学、健康与生命科学四大类,每类下再分小类,提供免费的浏览与检索。intute由联合信息委员会(Joint Information Systems Committee, JISC)资助,由英国七所大学所组成的联盟负责建设。
    从理念上讲,图书馆员们相信经人工选择与评价的网络资源优于搜索引擎的电脑排序算法,所以明知不可为而为之,在Google机器人尤无法爬遍的海量网络资源中精心选择高质量的网站,并且持之以恒(偶见一条的更新信息为2008年3月)。
    即使我不是图书馆员,我仍会相信由这样的网站(或曰资源发现门户)开始从事研究是很适合的,如同图书馆学网络资源入门宜从图书馆员因特网图书馆(INTERNET LIBRARY FOR LIBRARIANS)开始。

    除此之外,Intute提供一套不同专题的虚拟培训课程(Virtual Training Suite),是互联网教育与研究技能的免费在线培训课程,共有60多个专题,这些专题有的针对高校学生,有的针对成人学习者。高校图书馆如做面向学生的主题研究指南信息素养教育在线课程设计等,均值得参考。

   各专题课程结构相同,分四个部分,认真看完要1-2小时──当然不必一次完成,更可以跳着看:

    由TOUR介绍该专题最佳网站入手(自然侧重英国及欧洲网站),通过DISCOVER做专门搜索工具的实际操作(TRY IT),以及与通用搜索引擎的对比,强化学习者对专门搜索工具(主要是intute)的印象。随后就是图书馆员最为自豪的JUDGE,对资源质量的判断主要看3W──Who、Where、When,还可以从URL构成判断质量。SUCCESS若干取自网络的成功故事做示范,并提供更多相关网站。
    除了内容,课程设计得很细致:为不了解课程中涉及的IT用语者准备了词汇表(Glossary);各部分穿插小测试(QUIZ);课程中涉及的网站后有ADD按钮,可点击加入“链接篮”(Links basket)随时细看,并可加上点评、发送到自己的邮箱中;还可打印(Print)出美观的文本。

    课后有一个反馈,其中一个问题是“你最喜欢课程的什么”,我的回答是链接篮。作为一门研究入门课,还是比较枯燥的,并且其内容不可能在一二小时内就完全掌握,留下重要的资源以后参考、重要的信息慢慢消化,是十分必要的。

附:百度百科的intute词条
intute是英国七所大学合作构建的网络资源发现门户(RDN)整合了Altis、Artifact、BIOME、EEVL、GEsource、 Humbul、PSIgate、SOSIG八个非常有名的学科信息资源门户,分为科学技术、人文艺术、社会科学、健康与生命科学四个服务模块,提供由学科馆员选择和评价的高质量教育和研究方面的网络资源(英文)。
这是英国的一项免费为讲师、研究人员和学生们提供发现和获取高质量网络资源的国内服务,它以提供最高效的因特网资源来支持教育与科研活动。
由曼彻斯特大学的MIMAS牵头,由众多的合伙人和提供方共同协作的,整个组织的核心是一个包括七所大学在内的协会,汇聚了大量的丰富经验与专业知识。
Intute的资金来自JISC,同时受到艺术与人文研究委员会(AHRC)以及经济与社会研究委员会(ESRC)的协助。
网址为:http://www.intute.ac.uk/