如何让帮助系统更有帮助

今天中午,在学校听了系友、威斯康星大学密瓦基分校(UWM)解虹教授的报告──如何让帮助系统更有帮助。与会者基本为本校信息学系的教师及若干本馆同仁。
报告主要介绍其IMLS课题“数字图书馆新用户的帮助系统”(大致)。该课题公开征集180名调查者,让参与调查完成规定的搜索任务,在专用实验室中,采用morae记录用户的表情、声音(要求其自言自语,表述自己的内心活动)和点击等行为(应该是这个可用性软件吧),供随后分析。解教授另提及Jing,该公司的另一款免费软件。
从提问看,老师们更多地关注解教授的研究方法和研究过程。我主要对帮助系统本身,或者说什么帮助系统才是好的系统感兴趣。

报告首先介绍自己的研究领域,以其课题申报书的标签云始,说明其研究主题以信息检索为主。最后以本次报告的标签云终。

进入正题,从询问大家是不是用帮助系统开始,说明帮助系统一般不受用户欢迎,因为用户可能觉得看了帮助仍不明白,还不如自己摸索。报告后面也多次提到,用户更愿意问人,而非系统。其研究结果也是人工帮助不省时,但有更好的效果,更令用户满意。

报告把帮助系统分成两类:
一、显性的,比如直接以问号方式显示
二、隐性的,应情景而现,如检索后出现的“Do you mean …”,或者提示“Find like this”。
举了各种帮助的例子。首先提及但评价最底的是Google帮助[让我联想到Google软件商店糟糕的检索结果],对yahoo帮助比较称赞,也提及日渐受欢迎的可视化帮助。
其他帮助场景:
1、tutorials。举了云存储系统,完成若干任务可送多少免费空间──这种引导性极强的“帮助”功能,让用户非强制性地完成了帮助的学习。[金山快盘也如此]
2、tip,以举例方式提供帮助
3、联机帮助
特例:
1、国际儿童数字图书馆,以色彩提供帮助
2、肓人,以语音提供帮助
[自己则联想到其他在线帮助的情况:
比如软件的安装需要一定时间,在等候过程中提示功能,如搜狗拼音。
比如软件首次启动提示若干功能,显示完成后才能开始使用,iPad上不少软件升级后都如此]

研究结果显示人工帮助的优点:指点从哪里开始,指出问题所在,鼓励用户,交互,有效、理解、满意。对于机器来说,很难检测求助者状态,从而提供适当的帮助(目前有一些间接方法,如通过点击行为)。
要系统的帮助功能达到人工帮助水准,尚遥遥无期吧。对用户来说,目前好的结果从低到高依次是:1)检索词高亮;2)检索结果段高亮;3)直接给结果(如alpha wolfram)。

———-联想的分割线———-
听讲过程中,想到本馆网站和很多图书馆网站一样,在咨询页面最前给了FAQ链接,提示在咨询馆员前,应该先去FAQ看看是否已经有答案了──那个链接应该也是不招人喜欢的,谁知道点过去是什么情况?
现在打算把那里改成搜索框,提供FAQ直接查询,或许有人愿意在那里输入一个查询词,直接看看有没有结果?
由于FAQ的查询功能较弱(词串完全一致),所以检索框宽度应该设计得比较短,让用户只输入最简单的关键词──解教授报告中提到,界面会影用户的行为:比如检索框较长,用户输入的检索词长。

民国期刊全文数据库四种

民国期刊全文数据库,以前一直用国图和CADAL的。
最赞的是国图,完全公开访问。据河边前辈称国图的来自当年从全国征集的缩微期刊,因而只要有的品种,卷期都比较全。惜乎这事后来没有持续下去,所以国图民国期刊品种不算多,目前网站上提供4351种期刊。
相比之下,CADAL的民国期刊更为逊色。据2006年9月的检索结果,当时有民国期刊3802种,且卷期极为不全。看CADAL二期计划新增14万期(CADAL资源介绍),或可有所改善。

检索方面,国图目前优于CADAL的是提供目录(也就是篇名)检索,但检索结果到刊而非到期,因而这种“目录”检索基本上是无用的功能。试想如果该刊有30期,除了一期期看过来,没有办法知道想要看的到底是哪期,更不会说是哪篇(具体页码),还有多大的意义?
作为全文库,国图和CADAL的民国期刊库存在一个致命缺陷──没有篇作者信息。由于不是基于篇名做索引,而是以期为单位做目次,既没有给篇作者定义元数据,做目次时也没有录入作者信息,导致以现有信息根本没有办法查到篇作者。未来如果不辅以强大的技术手段提升其功能(OCR识别全文并定位作者),无法改变现状。
简言之,国图和CADAL民国期刊库的最大问题在于它们作为检索工具,只是目录而非索引。期刊目录基本上只适合查找从其他来源已知的文献,根据已知的刊名、卷期找到所需文章。期刊索引才能发现文献,对旧刊来说,特别有用的是查找某位作者有哪些文章,发表在什么期刊、何卷、何期。

去年底《大成老旧刊全文数据库》在本馆试用,这是个基于篇的期刊索引库,据称有6千余种刊、12万多期、150万余篇文章。当时用一位民国作者查了一下,可以查到一些,但由于没有比对,不清楚覆盖范围。
前不久微博得知《复印报刊资料》《全国报刊索引》也有《民国期刊全文数据库》,然后在本馆网站上发现3月下旬曾有短暂试用。现在虽然已经结束试用,或许因为在继续试用它家的《民国时期期刊篇名数据库》的缘故,全文库仍可以查(不能下载全文),于是用同一位作者查了一下,命中结果是大成的近十倍!不过并没有涵盖所有大成的期刊(但其篇名库有)。看介绍目前收录5千多种4百万篇(比大成品种少、但篇数多,可见卷期较全),最终会达到2万多种,如此,恐怕无敌了。
有点奇怪的是,篇名库与全文库并不对应,还有全文库有、篇名库却没有的情况。

———-民国期刊全文库四种———-
国家图书馆:民国中文期刊
来自缩微胶片的数字扫描工作,预计将在三年内完成近600万拍缩微胶片的数字转换。现提供4351种期刊电子影像的全文浏览。资源库遵循边建设边服务的原则,将不断追加更新资源库内容。
访问网址:http://res4.nlc.gov.cn/home/index.trs?channelid=6(公开访问、全文浏览)

CADAL(高等学校中英文图书数字化国际合作计划)
已建资源:236,594册民国书刊(未区分书刊);在建资源:民国文献20万册(期),包括:民国图书4万册,民国期刊14万期,民国报纸2万期。
访问网址:http://www.cadal.cn/(公开查询、注册后全文浏览──特定IP范围?)

《大成老旧刊全文数据库》
收录清末自有期刊以来到1949年以前(1840-1949),中国出版的6000余种期刊,共12万多期,150万余篇文章。
访问网址:www.dachengdata.com
提供公开检索,检索途径:题名(篇名)、作者、内容提要、刊名。检索一览显示:题名、作者、刊名、年卷期。──即使没有买该库,作为查找工具也不错。

《民国时期期刊全文数据库(1911~1949)》(《全国报刊索引》)
计划收录民国时期(1911~1949)出版的两万余种期刊,一千五百余万篇文献。
分辑出版(每辑250GB),目前的数量:
第一辑 1142种 31533期 811044篇
第二辑 1245种 28263期 830326篇
第三辑 1145种 31382期 794213篇
第四辑 2098种 30856期 804569篇
第五辑 (种、期不详)769345篇
《全国报刊索引》以索引起家、目前仍在销售篇名库,因之该库不登录不能查,对未订购者,这访问网址也没啥意思了:www.cnbksy.cn

P.S. 一直很奇怪,民国元年明明是1912年,为啥我们的民国文献都是从1911年开始算的呢?

———-分割线———-

《晚清期刊全文库(1833-1910)》试用记 (2010年11月29日)

电子版民国图书和期刊 (2006年9月27日)

国家图书馆民国期刊全文下载方法 (2007年10月18日)──方法已失效

国家图书馆民国电子书 (2007年6月26日)

Google学术计量──Google期刊排名发布

Google学术计量(Google Scholar Metrics)据说是今年4月1日发布的,列在Google学术页面,应该不是愚人节玩笑。这是自Google去年末推出针对个人的Google学术引用后,Google进入引文分析领域的又一个重要标志。

按其说明,Google学术计量的主要指标针对出版物(期刊)h指数:
h指数:出版物至少有h篇文章每篇被引至少h次;
h核心:出版物最高被引的h篇文章;
h中值:h核心文章被引量的中值。
Google仅计算出版物最近5年内发表文章的上述值,即h5指数、h5核心和h5中值。

目前在Google学术的检索结果页面看不出信息的呈现,也不清楚出版物h指数是否会影响检索结果的排序,或者提供某种限定检索条件。但Google给出了英、汉、萄、德、西、法、韩、日、荷、意10种语言期刊h指数前100的排名,h中值用于相同h指数期刊的辅助排序。目前的排名依据是2007-2011发表文章(五年整),被引数据以2012.4.1为准。
点击各期刊的h5指数链接,可以看到h5核心,即哪些文章对期刊进入排名有贡献,并有文章被引次数及发表年份。
从各语种h指数看,英语排名第1的是Nature,h5指数295,排名100的h5指数也有88,高于所有其他语种排名第1的h5指数。有些语种因h5太低,都没列满100种。中文h5指数仅次于英语,最高的是《经济研究》46。
有意思的是,中文Top 100中有8种图情期刊,作为一个小学科,比例不低:
排名 刊名 h5指数 h5中值
37. 中国图书馆学报 23 34
38. 大学图书馆学报 23 31
44. 图书情报工作 22 28
59. 图书馆论坛 21 27
68. 图书与情报 20 29
80. 图书馆建设 20 24
85. 图书馆 20 23
98. 图书馆杂志 19 26

via [IFLA-L] Google Starts Ranking Journals / McKiernan, Gerard

参见:Google学术引用初探 (2011年11月19日)