CNKI的引文检索功能(兼及维普)

    前些日子写“黄雀在后的《中文社会科学引文索引》”,因为CSSCI实在让人为之担忧(纯属自作多情)。而“期刊网”虽非专为引文分析而做,但作为一个副产品,可以查到的引文结果更多。查了几个人,在基本相同的时间段中,通过期刊网查到的结果均数倍甚至十倍于CSSCI。CNKI引文功能的市场前景比CSSCI乐观得多,当然还大有发展余地。

    通称的中国期刊网,现在其收录范围已经不限于期刊,正式名称不知何时变成了“中国知网”(CNKI)。前段日子改版后,其“ 中国学术期刊全文数据库”改变了以检索结果一览表提供单篇文章下载的简单形式,强化了相关文献分析与链接功能。点击单篇文献后,“关键词”有了链接检索功能,另外还有同类文献链接、相关研究机构链接、相关文献作者链接、相关关键词链接、中图法分类文献导航(分类检索链接)。

    单篇文献页面上方,还有目前尚不可用的“参考文献链接”和“引证文献链接”。不知道是本馆购买的产品功能不全,还是CNKI确未开通此功能。想来“参考文献链接”应该是本文引用文献链接,而“引证文献链接”应该是引用本文文献的链接。只要不是高产作者,未来通过“引证文献链接”逐篇统计某作者期刊论文被引情况,应该是十分方便的。

    现在提供的引文检索功能,是首页的检索项“参考文献”。通过“参考文献”可以进行更广泛的被引文献检索――包括CNKI收录期刊论文引用的其他类型文献,如专著、论文集等。奇怪的是,在其他检索状态下(无论是初级检索、高级检索还是专业检索),都没有“参考文献”检索功能。
    “参考文献”检索在缺省情况下依时间倒序列出检索结果。分别显示引用文献的题名、来源(刊名)、年期等。要知道是某人的哪篇文章被引?目前还得逐篇下载看个究竟。如果前述“参考文献链接”功能可用,则只需看此链接即可,无需逐篇下载。只是仍需要手工汇总非期刊被引文献的被引次数等信息。

    更原始且不依赖CNKI特定功能的方法,是多年前某网友介绍的,即通过CNKI的“全文”检索功能,查作者姓名。和在Google中查人名一样,这种方法对于姓名比较常见,或双字姓名等情况,查准率相当低,需要花不少工夫筛掉不希望出现的结果。

    引文统计分析最大的问题,就是来源文献的参考文献信息不准确,前面讲CSSCI例子时已经看到一些。目前还看不出CNKI处理功夫如何,但从“CNKI的中国学术期刊综合引证报告”的宣传资料来看,CNKI“ 执行《中国学术期刊(光盘版)检索与评价数据规范》(CAJ-CD B/T1-1998),加强了引文数据的规范化、标准化”,听上去很是专业。
    《中国学术期刊综合引证报告》2002年试刊后,已经在单位的文献评价这一层次得到了不少“订单”:

  • 2002年以来北京大学、北京师范大学等50余所高校社会科学学报引文统计分析
  • 2002年以来清华大学出版社出版图书的引用统计
  • 2003年306所高校申报博、硕士学位授权单位文献评估
  • 2004年北京交通大学等22所高校研究生院设置文献评估
  • 2004年500余所高校重点学科建设研究文献统计

    有规范化的引文数据做保障,如SCI/SSCI一般,未来CNKI“ 中国学术期刊全文数据库”再占领个人文献评价市场,似乎也是顺理成章的事了。

附:维普资讯网的引文检索功能
    维普资讯网(http://www.tydata.com/www.cqvip.com)的“中刊库(引文版)”,有“源文献-->被引文献”和“被引文献-->源文献”二个检索途径。“被引文献-->源文献”,有篇名、刊名、作者三个检索途径,检索结果为被引文献的作者、题名、刊名、卷期等。但没有显示引用文献及引用次数。
    尽管其收录期刊种类与年限多于CSSCI,但从检索结果看,数量甚至还少于CSSCI。我以自己为例,对比了源文献与被引文献的检索结果,明显看出其数据有遗漏。应该在技术上还有重大问题没有解决。
    维普如要发展引文这一块,看来要改善的地方比CSSCI还要多。

 

黄雀在后的《中文社会科学引文索引》

    老槐由《中文社会科学引文索引》(CSSCI)谈“04年图情牛饮”,我也去看上一把。发现CSSCI在“来源文献”部分多了全文显示(或许原来就有而没有注意),而“被引文献”这一块一如既往,没有什么改进。
    CSSCI引文部分仍是“剪刀+浆糊”的产物,基本上是来源中参考文献怎么写,CSSCI就怎么统计引文信息,没有做最简单的处理。
    没有各年引文信息合并统计这一功能,所以如果检索各年(1998-2004),提示信息是被引7篇,很可能根本就是同一篇(或几篇),在不同的年份被引。
    而且同一年中,只要是来源文献的引文信息写得略有差异,也就成为不同的文献。所以“被引X篇”,即使在同一年中,也根本是形同虚设。
    以查“谢琴芳”为例,各年中同一本书《CALIS联机合作编目手册》,因为有时参考文献中写有(上)(下)(上册)(下册)(上、下册),或者题名有些小误而成为不同的文献。
    如果说专著信息合并由于缺乏依据不太简单,那么期刊信息合并应该不难。不知道CSSCI是否有过这方面的设计,至少到目前为止,还根本没有看到这方面的措施。
    以查“刘素清”为例,2004年被引4篇:
电子资源著录――AACR2第9章修订情况简介 大学图书馆学报 2003(3):74―78
电子资源著录―― AACR2第9章修订情况简介 大学图书馆学报 2003(3):74―78
虚拟联合目录与传统联合目录数据库的比较――对我国联机联合目录数据库建设模式的思考 大学图书馆学报 2002(4)
虚拟联合目录与传统联机联合目录数据库的比较――对我国联机联合目录数据库建设模式的思考 大学图书馆学报 2002(4):7―11
    显然应该是2篇。第1、2篇就因为差了一个空格而成为不同文献。第3、4篇题名小有差异,但也不难判断是同一篇文献。
     要引文处理像编目一样,对文献题名标点符号与空格等进行处理似乎没有必要,因为从上例及其它检索结果可知,这种处理只能解决小部分问题,不能解决常见的来源文献引用信息错误问题。但对于上述涉及的《大学图书馆学报》等CSSCI收录期刊,只要与该收录期刊相应卷期收录文献核对,就可简单地修正来源文献的引文信息错误,对相应信息进行合并。这种核对、修正,用计算机处理根本不需要人工智能之类的高技术,不过是小菜一碟。说句大话,我也可以让计算机做到。即使是CSSCI未收录的期刊,同一期刊、同一卷期、同一页码,是不可能发表两篇不同文献的,对有关信息进行合并,用计算机处理也不是难事。至少对题名或姓名有误的信息是可以合并的(可能需要少量人工干预),即使由于信息不全(如未标页码),为谨慎起见不能做到完全合并,至少也应该让用户看到CSSCI在这方面的努力。
     CSSCI提供来源文献全文,只不过是已有扫描识别文献的副产品,不需要花什么功夫。在期刊网维普也已经开始提供引文查找功能后,如果CSSCI不在自己赖以为生的核心能力上花些功夫,要与收录全文文献范围及年限均大得多的期刊网、维普竞争,前景不容乐观。