黄雀在后的《中文社会科学引文索引》

    老槐由《中文社会科学引文索引》(CSSCI)谈“04年图情牛饮”,我也去看上一把。发现CSSCI在“来源文献”部分多了全文显示(或许原来就有而没有注意),而“被引文献”这一块一如既往,没有什么改进。
    CSSCI引文部分仍是“剪刀+浆糊”的产物,基本上是来源中参考文献怎么写,CSSCI就怎么统计引文信息,没有做最简单的处理。
    没有各年引文信息合并统计这一功能,所以如果检索各年(1998-2004),提示信息是被引7篇,很可能根本就是同一篇(或几篇),在不同的年份被引。
    而且同一年中,只要是来源文献的引文信息写得略有差异,也就成为不同的文献。所以“被引X篇”,即使在同一年中,也根本是形同虚设。
    以查“谢琴芳”为例,各年中同一本书《CALIS联机合作编目手册》,因为有时参考文献中写有(上)(下)(上册)(下册)(上、下册),或者题名有些小误而成为不同的文献。
    如果说专著信息合并由于缺乏依据不太简单,那么期刊信息合并应该不难。不知道CSSCI是否有过这方面的设计,至少到目前为止,还根本没有看到这方面的措施。
    以查“刘素清”为例,2004年被引4篇:
电子资源著录――AACR2第9章修订情况简介 大学图书馆学报 2003(3):74―78
电子资源著录―― AACR2第9章修订情况简介 大学图书馆学报 2003(3):74―78
虚拟联合目录与传统联合目录数据库的比较――对我国联机联合目录数据库建设模式的思考 大学图书馆学报 2002(4)
虚拟联合目录与传统联机联合目录数据库的比较――对我国联机联合目录数据库建设模式的思考 大学图书馆学报 2002(4):7―11
    显然应该是2篇。第1、2篇就因为差了一个空格而成为不同文献。第3、4篇题名小有差异,但也不难判断是同一篇文献。
     要引文处理像编目一样,对文献题名标点符号与空格等进行处理似乎没有必要,因为从上例及其它检索结果可知,这种处理只能解决小部分问题,不能解决常见的来源文献引用信息错误问题。但对于上述涉及的《大学图书馆学报》等CSSCI收录期刊,只要与该收录期刊相应卷期收录文献核对,就可简单地修正来源文献的引文信息错误,对相应信息进行合并。这种核对、修正,用计算机处理根本不需要人工智能之类的高技术,不过是小菜一碟。说句大话,我也可以让计算机做到。即使是CSSCI未收录的期刊,同一期刊、同一卷期、同一页码,是不可能发表两篇不同文献的,对有关信息进行合并,用计算机处理也不是难事。至少对题名或姓名有误的信息是可以合并的(可能需要少量人工干预),即使由于信息不全(如未标页码),为谨慎起见不能做到完全合并,至少也应该让用户看到CSSCI在这方面的努力。
     CSSCI提供来源文献全文,只不过是已有扫描识别文献的副产品,不需要花什么功夫。在期刊网维普也已经开始提供引文查找功能后,如果CSSCI不在自己赖以为生的核心能力上花些功夫,要与收录全文文献范围及年限均大得多的期刊网、维普竞争,前景不容乐观。