前两天看到丫枝转贴“谁是优秀的科学家 H指数来预测”:
“H指数是2005年加利福尼亚大学圣地亚哥分校统计物理学家赫希在2005年发明的,立刻引起了全世界学术界的广泛关注,论文在网上公布后,《自然》和《科学》杂志先后报道,正式论文于2005年11月正式发表在《美国科学院院刊》上。”(Hirsch, J. E. An index to quantify an individual’s scientific research output. Proceedings of the National Academy of Sciences, 102, 16569–16572 (2005))
“在H指数发明之前,常见的评估学术成就的方法有论文的总篇数和总引用率。但是前者的问题在于,那些只大量发表低影响力论文的人会因此受益,而后者的问题在于,一两篇高引用率的文章会掩盖了大量低引用率的文章。相比较而言,更公平的做法是计算文章的平均引用率。”
“但是,H指数已经被公认为比平均引用率更科学的指标。所谓H指数,是指一个人有N篇论文分别被引用了至少N次。例如,普林斯顿高等研究所的物理学家爱德·威顿(Ed Witten)的H指数是110,表明他有110篇文章每篇至少被引用了110次。”
“与其它统计方法不同的是,要确定一个人的H指数相当容易,只要到SCI网站,查出某个人发表的所有SCI论文,让其按被引次数从高到低排列,往下核对,直到某篇论文的序号大于该论文被引次数,那个序号减去1就是H指数。”
“赫希说:‘各个领域的人都在使用或者考虑使用H指数,将它作为招聘和研究经费评审的标准。我就亲眼见到过一些人在找工作的时候把H指数写进了简历。’”
丫枝给的标题是“SCI与H指数:学术水平”,原文也是以SCI为例,说明H指数的获取方式。昨天与Elsevier的孙晓鹏聊天,谈到Scopus也有自己的H指数,并且2007年开始在检索结果中直接提供H指数链接,免去了排序、查找的麻烦。
与SCI相比,Scopus的来源文献量较大,但收录的引文数据年限较短:
Scopus:来源:15000种同行评议期刊,最早回溯到期刊首期/1900年,文摘量3300百万;引文数据:1996-
Web of Science:来源:约8700种;引文数据:SCI,1900-;SSCI,1956-;A&HCI,1975-
另一方面,Scopus有作者标识系统(Author identifier),对人名的做了一定的规范,或许对同名者的区分度要好于SCI。因为有上述种种差别,同一作者在SCI与Scopus中的H指数值肯定是不同的。
如果有兴趣,或许或以做一下SCI与Scopus的H指数的对比研究。Scopus目前国内订购的还不太多,可以在它的网站上注册30天免费试用。
Elsevier有针对图书馆员的电子版连续出版物LibraryConnect,并不定期地出版一些很实用的专题小册子。记得一年前曾向他们索取过印刷本,后来曾收到电邮告诉有一些有中文版。第9号小册子就是关于Scopus的:Using Scopus for Bibliometric Analysis: A Practical Guide(中文版:利用Scopus进行文献计量分析:应用指南),可以参考。
赫希像当年的加菲尔德那样,持续不断地“挖掘”H指数的内涵,从评价到预测(Does the h-index have predictive power? ),或许H指数会日益引人注目。未来印上名片的可能性也存在啊^-^
其实只要有引文信息的数据库,都可以提供自己的H指数,中文的也一样。引文数据的排序很简单,关键问题是对同名作者的识别、被引文献的唯一性处理──不解决这两个问题,引文数据库提供出来的数字就是捣浆糊了。
参见:
Scopus的作者规范与分面检索 (2007-02-08)
黄雀在后的《中文社会科学引文索引》 (2005-07-11)
CNKI的引文检索功能(兼及维普)(2005-09-14)
update (2007-9-14): 近段日子有事忙,很少看博。今日暂休,才看到图林中文译站上的两篇相关译稿:
总的说来,我对物理更感兴趣,而非引文
原文:Overall, I’m more interested in physics than citations
作者:Jorge Hirsch, 物理学教授,美国加州大学圣地亚哥分校
科研成果评价体系正在加快发展的步伐
原文:Research Performance Measurement is revving up
作者:Helen de Mooij, Scopus 产品经理, Elsevier, 阿姆斯特丹, 荷兰
两篇均出自LibraryConnect,背景参见:山高水长:图林中文译站产生了国际影响