试用维普中国科学指标数据库

    前一阵用CNKI的《中国引文数据库,感觉不错。看到本馆试用维普的《中国科学指标数据库(CSI),赶紧试试,也可对照感受一下。

三个模块:
排名分析:学者、机构、地区、期刊
学科评估:学科排名、学科基线、研究前沿
顶尖论文:高被引论文、热点论文

学者排名:“展示各学科核心研究成员及其研究成果,提供各学科学者的科学指标查询”。可按学科、作者、机构、地区选择或检索查看,再按发文量、被引量、篇均被引值排序。

    选择学科“图书馆情报学”,缺省按被引量排序,改按篇均被引值排序,结果发现“郑州大学”的“程焕文”只发了1篇文章,就被引110次,真是太牛了(点击该文,显示被引量为108次,二者竟然不一致)。
    点击看“顶尖论文”,含意不明,比如图书馆情报学被引量排名第一的张晓林,顶尖论文4篇,被引量从81到21不等;而排第三的范并思,顶尖论文12篇,被引量从146到2不等。差别也太大了。
    点击看“趋势图”,更有意思了,不是逐年、而是交叉的5年时间段,显示发文量、被引量、篇均被引值的柱形图。

期刊排名:选择学科,图书馆情报学有1190种。按篇均被引值排序,原来依据的是刊登文章的学科,不少期刊发文量只有一篇。这也有一定的合理性。

研究前沿:“科学家紧密联系的研究区域一定程度上代表了学科发展的前沿区域”。选择学科,或者查关键词。
    图书馆情报学:列出了17个研究前沿,按被引排名第一的是“公共图书馆 图书馆精神 服务 图书馆权利”,不知道是如何组合出来的。一览表中列有平均发表年,有好几个都是2001年的,不论其主题如何,仅从年份而言,8年前的还能称“前沿”吗?
    关键词:查“数字图书馆”、“编目”、“文献”都没有结果,实在不甘心,查“图书馆”,总算有了14个结果──应该说“关键词”是名不符实的。点击第1个”公共图书馆 图书馆精神 服务 图书馆权利”,跳出来一个很酷的关系图,每一个节点都链接到图下的文章信息,边上有下载全文链接:

热点论文:“近两年发表的,在一个较短时间内被高度关注的论文是一个潜在的研究热点”
    图书馆情报学:列出79条,被引数在20到2之间,时间在2006年中以后。全部学科有2006年第1期的,似乎不同学科年限不尽一致。

   
印象中维普收录期刊数量一直在CNKI之上,但从CSI引文数据看,应该在CNKI之下。比如查机构,本校被引量最前的二篇均为范并思的,肯定会让本校众多教育学科的大牛不爽。再比如那篇”图书馆2.0:构建新的图书馆服务“,在CSI被引145次,而在CNKI中接近翻番。
     找来两方的介绍做一下对比:
CNKI《中国引文数据库》“收录了中国学术期刊(光盘版)电子杂志社出版的所有源数据库产品的参考文献……截至2007年12月,累计链接被引文献达 6848642 篇”。
维普《中国科学指标数据库》(CSI)“涵盖了包括理、工、农、医和社会科学等方面的4000余种期刊,数据评价时段从2000年跨度至当前,每双月更新”。与维普《中文科技期刊数据库(引文版)》“收录1989年以来8000多种期刊论文的参考文献”相比,竟然少了一半──实在想不通啊。

    总的来说,维普CSI是一个与CNKI引文库不同的产品,只是数据的数量与质量均差强人意,可用性就存疑了。虽然不知道二个产品内在运行机制,但从上述自我介绍及使用感受,CNKI引文数据应该是与主库同步的,数据量大、动态性好,而维普CSI却是独立于主库的产品,技术上似乎就落后了一截。现在H指数作为个人评价指标很流行,但维普如此数据,显然不敢提供──某人在CNKI的H指数为9,到了维普,竟只有1,谁还用它?

《试用维普中国科学指标数据库》上有5条评论

  1. 精灵老师,我也不看好维普做这方面的产品,核心的原因是维普在处理参考文献的时候,做的不细致,维普也没花力气去仔细认真的处理这些基础数据;如果基础数据有很大的出入,那出来的结果能正确吗?建议维普还是夹紧尾巴把全文库做好。

  2. 感谢精灵老师的试用评论,感谢CC的忠告;
    做为CSI产品的设计人员,我先阐述一下CSI的设计初衷,CSI是想立足于最近10年期刊文献的引用情况做各学科发展轨迹的一个基于引文事实的评价

    ,通过该产品,可以使科研团体、科研工作者、科学评估人员和决策咨询人员基于客观量化标准来认识国内近10年来科研发展的整体水平和趋势、各

    地区科研发展状况及对各学科发展产生较大影响的科研群体,我们不妄想也不期待CSI产品用来做研究人员或者研究机构学术水平的鉴定,事实上,

    我们也做不了这个。被引次数反映的就是被关注的程度,而且,CSI所反映的被关注程度还是基于最近10年的期刊文献的引用情况做的。CSI产品就是

    想为大家了解科学发展的过程提供一个参考,至于大家怎么用?能用到什么程度则取决于用户的需求。
    因此,CSI不同于引文库产品,她不是针对全部作者或者全部机构的所有引文情况做的统计,她是有时间限制的(最近10年),也是有范围限制的(

    基于4000多种期刊文章的引用情况来做的),所以,用CSI来推断H指数也是不合适的;
    评价基础是根据每篇文章的中图分类来实施的(精灵老师很厉害,一眼就看出了这种实施手段),既然是基于事实评价,我们希望每一个评价元素都

    是原始状态;
    CSI也做了期刊筛选,不是所有的引文期刊或者中刊库里收录的期刊都拿来做评价(这一点精灵老师可能有点误会了,以为我们的中刊库只有那么点

    期刊),筛选的目的是想基于各学科科学研究发展做评价,一些科学普及类期刊和文摘索引类期刊没有入选;
    当然,这项新产品还有许多要改进的地方,我们对每个评价学者和机构都做了人工整理,希望对同名作者情况能有所区别,对同一作者更换了不同单

    位的数据有所归并,对机构合并和更名情况也能做数据延续,等等,但是没做到位,还出现了错误,被精灵老师发现了(中山大学图书馆程焕文馆长

    的统计数据出现错误,把合作作者的单位加在程馆长身上了,在此向程馆长道歉),另外就是有些数据统计有出入,这些都是我们要整改的地方。
    对CC老师所说(维普也没花力气去仔细认真的处理这些基础数据),我想跟CC解释,目前维普正在花力气去做这个事情,当然,做的还不好,还需要

    花更多的力气,所以要谢谢CC的忠告,我们有尾巴,一定要夹紧!
    对于顶尖论文和研究前沿等概念,如果精灵老师有兴趣,可以看一下CSI的使用说明文档,都在这解释,篇幅太长了,也要把大家累到!
    博主 对 CSIdesigner 的回复: 2009-11-25 17:54:44
    谢谢CSIdesigner的细致回复。我有一些不同的看法。

    对于立足最近10年,“研究前沿”显示最新情况是应该的,但显示学科发展轨迹,自然是时间段越长越好(如果能够提示以前的研究前沿,也是很有意思的)。

    至于筛选期刊,更没有必要。科普类、文摘索引类期刊,本身没有引文,不会有相关数据,也就自然排除在外了。

    对于作者更换单位的,归并起来既吃力又不讨好,因为这涉及到单位署名权,如果计成果,也不能算在最后单位的。可以借鉴CNKI,检索作者时可输入多个单位。(至于程馆长那篇文章,合作者也是中大的,为何出错有些蹊跷)

    最后,很不好意思,竟然没有看到使用说明文档:(

  3. 半个月前馆长也让俺适用了,测试我馆高产作者排名情况,居然没有!分析排名,被引一篇都有排名,在CNKI被引几十次的为何在维普里没有?在线询问维普客服,忽悠了我半天也没解释满意,说给我打电话,等了半个月没电话。一开始也以为程馆长秘密调郑大了,“程馆长那篇文章,合作者也是中大”调阅原文另一作者王蕾当时署名单位是郑大,现在是中大馆的。
    维普这个在学sci的 ESI

    博主 对 yeqing 的回复: 2009-11-26 20:02:34
    我看维普链接,王蕾署中大,看来是二人单位弄反了。

  4. 唉,图林老姜还是犯了维普系一直在犯的错误:事情做错了,却一直在用八杆子打不着的理由来推脱,对于存在的问题却迟迟不改。
    毕竟CSI还是靠准确的引文数据和完整的文献量来说事的,如果存在参考文献没标出来和一贯的缺刊缺期,没有那个图书馆敢轻易买这种产品。如果读者的论文里引用了CSI的指标的,却事实被证明是错误的结论,那图书馆是不是还存在引进资源把关不严的问题?
    博主 对 cc 的回复: 2009-11-29 22:43:37
    嘿嘿,下面的长篇大论可不是老姜写的。

评论已关闭。