民国期刊全文数据库四种

民国期刊全文数据库,以前一直用国图和CADAL的。
最赞的是国图,完全公开访问。据河边前辈称国图的来自当年从全国征集的缩微期刊,因而只要有的品种,卷期都比较全。惜乎这事后来没有持续下去,所以国图民国期刊品种不算多,目前网站上提供4351种期刊。
相比之下,CADAL的民国期刊更为逊色。据2006年9月的检索结果,当时有民国期刊3802种,且卷期极为不全。看CADAL二期计划新增14万期(CADAL资源介绍),或可有所改善。

检索方面,国图目前优于CADAL的是提供目录(也就是篇名)检索,但检索结果到刊而非到期,因而这种“目录”检索基本上是无用的功能。试想如果该刊有30期,除了一期期看过来,没有办法知道想要看的到底是哪期,更不会说是哪篇(具体页码),还有多大的意义?
作为全文库,国图和CADAL的民国期刊库存在一个致命缺陷──没有篇作者信息。由于不是基于篇名做索引,而是以期为单位做目次,既没有给篇作者定义元数据,做目次时也没有录入作者信息,导致以现有信息根本没有办法查到篇作者。未来如果不辅以强大的技术手段提升其功能(OCR识别全文并定位作者),无法改变现状。
简言之,国图和CADAL民国期刊库的最大问题在于它们作为检索工具,只是目录而非索引。期刊目录基本上只适合查找从其他来源已知的文献,根据已知的刊名、卷期找到所需文章。期刊索引才能发现文献,对旧刊来说,特别有用的是查找某位作者有哪些文章,发表在什么期刊、何卷、何期。

去年底《大成老旧刊全文数据库》在本馆试用,这是个基于篇的期刊索引库,据称有6千余种刊、12万多期、150万余篇文章。当时用一位民国作者查了一下,可以查到一些,但由于没有比对,不清楚覆盖范围。
前不久微博得知《复印报刊资料》《全国报刊索引》也有《民国期刊全文数据库》,然后在本馆网站上发现3月下旬曾有短暂试用。现在虽然已经结束试用,或许因为在继续试用它家的《民国时期期刊篇名数据库》的缘故,全文库仍可以查(不能下载全文),于是用同一位作者查了一下,命中结果是大成的近十倍!不过并没有涵盖所有大成的期刊(但其篇名库有)。看介绍目前收录5千多种4百万篇(比大成品种少、但篇数多,可见卷期较全),最终会达到2万多种,如此,恐怕无敌了。
有点奇怪的是,篇名库与全文库并不对应,还有全文库有、篇名库却没有的情况。

———-民国期刊全文库四种———-
国家图书馆:民国中文期刊
来自缩微胶片的数字扫描工作,预计将在三年内完成近600万拍缩微胶片的数字转换。现提供4351种期刊电子影像的全文浏览。资源库遵循边建设边服务的原则,将不断追加更新资源库内容。
访问网址:http://res4.nlc.gov.cn/home/index.trs?channelid=6(公开访问、全文浏览)

CADAL(高等学校中英文图书数字化国际合作计划)
已建资源:236,594册民国书刊(未区分书刊);在建资源:民国文献20万册(期),包括:民国图书4万册,民国期刊14万期,民国报纸2万期。
访问网址:http://www.cadal.cn/(公开查询、注册后全文浏览──特定IP范围?)

《大成老旧刊全文数据库》
收录清末自有期刊以来到1949年以前(1840-1949),中国出版的6000余种期刊,共12万多期,150万余篇文章。
访问网址:www.dachengdata.com
提供公开检索,检索途径:题名(篇名)、作者、内容提要、刊名。检索一览显示:题名、作者、刊名、年卷期。──即使没有买该库,作为查找工具也不错。

《民国时期期刊全文数据库(1911~1949)》(《全国报刊索引》)
计划收录民国时期(1911~1949)出版的两万余种期刊,一千五百余万篇文献。
分辑出版(每辑250GB),目前的数量:
第一辑 1142种 31533期 811044篇
第二辑 1245种 28263期 830326篇
第三辑 1145种 31382期 794213篇
第四辑 2098种 30856期 804569篇
第五辑 (种、期不详)769345篇
《全国报刊索引》以索引起家、目前仍在销售篇名库,因之该库不登录不能查,对未订购者,这访问网址也没啥意思了:www.cnbksy.cn

P.S. 一直很奇怪,民国元年明明是1912年,为啥我们的民国文献都是从1911年开始算的呢?

———-分割线———-

《晚清期刊全文库(1833-1910)》试用记 (2010年11月29日)

电子版民国图书和期刊 (2006年9月27日)

国家图书馆民国期刊全文下载方法 (2007年10月18日)──方法已失效

国家图书馆民国电子书 (2007年6月26日)

Google学术计量──Google期刊排名发布

Google学术计量(Google Scholar Metrics)据说是今年4月1日发布的,列在Google学术页面,应该不是愚人节玩笑。这是自Google去年末推出针对个人的Google学术引用后,Google进入引文分析领域的又一个重要标志。

按其说明,Google学术计量的主要指标针对出版物(期刊)h指数:
h指数:出版物至少有h篇文章每篇被引至少h次;
h核心:出版物最高被引的h篇文章;
h中值:h核心文章被引量的中值。
Google仅计算出版物最近5年内发表文章的上述值,即h5指数、h5核心和h5中值。

目前在Google学术的检索结果页面看不出信息的呈现,也不清楚出版物h指数是否会影响检索结果的排序,或者提供某种限定检索条件。但Google给出了英、汉、萄、德、西、法、韩、日、荷、意10种语言期刊h指数前100的排名,h中值用于相同h指数期刊的辅助排序。目前的排名依据是2007-2011发表文章(五年整),被引数据以2012.4.1为准。
点击各期刊的h5指数链接,可以看到h5核心,即哪些文章对期刊进入排名有贡献,并有文章被引次数及发表年份。
从各语种h指数看,英语排名第1的是Nature,h5指数295,排名100的h5指数也有88,高于所有其他语种排名第1的h5指数。有些语种因h5太低,都没列满100种。中文h5指数仅次于英语,最高的是《经济研究》46。
有意思的是,中文Top 100中有8种图情期刊,作为一个小学科,比例不低:
排名 刊名 h5指数 h5中值
37. 中国图书馆学报 23 34
38. 大学图书馆学报 23 31
44. 图书情报工作 22 28
59. 图书馆论坛 21 27
68. 图书与情报 20 29
80. 图书馆建设 20 24
85. 图书馆 20 23
98. 图书馆杂志 19 26

via [IFLA-L] Google Starts Ranking Journals / McKiernan, Gerard

参见:Google学术引用初探 (2011年11月19日)

Google学术引用初探

Google学术搜索推出引文分析服务,三个简单步骤即可给出一份作者的引用档案(Citation Profile)。以自己做小白鼠,试用了一下。基本结论是,除了数据来源有待开拓,功能强大、操作方便、细节贴心。
数据来源问题,一是作者文献是否收录完整,二是引用来源是否权威,其实对引文分析来说是致命的。后者比较容易解决,如果需要,对引用来源做一个分级,对擅长数据处理的Google来说不是难事。比较困难的是前者,此服务推出,或许会进一步阻碍有类似服务的数据库供应商向其提供信息。比如目前中文来源看到有万方、维普、CNKI和其他零散来源,CNKI会不会担心影响自己的引文数据库?现在来看,与直接在来源数据库搜索的篇数比对,至少维普和CNKI的信息是不完整的。

———-三步操作———-
注册入口

1、建档
提供4项基本信息:姓名、单位、认证邮箱、兴趣领域。
单位和兴趣领域对自动筛选同名作者至关重要。单位邮箱是认证用的,如引文分析报告选择公开,会有认证标识。
2、文章
根据第1步提供的基本信息,自动出现检索结果,可以浏览后直接加入(add)。从我的结果看,没有错误。
由于我建档时提供的是英文信息,检出篇数太少(英文题名)。这时在检索框中改用中文姓名检索,检出较多篇数(中文题名)。结果同样没有错误,全部加入。
在检索结果集中,会出现合作者。由于自己名下会检出自己非第一作者的文章,所以通常不需要在合作者中做筛选。
3、更新
选择自动更新还是邮件告知,应该主要针对公开自己引文分析报告的人。
这一步实际上不需要做任何事情,直接点击去看建成的档案就行了。

在建成的档案页面,可以选择公开自己的档案(先预览──这是必须的)。
以后大概会流行在个人信息(如个人网站、社交网络等)中加入Google学术引用档案了。

———-Google学术引用档案样本———-
Google员工:Anurag Acharya

§ 右侧栏列出合作者:有助了解其学术合作伙伴(建档者可以选择删除某人,这个比较贴心)

§ 除了显眼的引文年代分布图外,引文指数包括所有年代和近5年的两组引文数据:
被引量、h指数、i10指数
根据说明,i10指数指被引至少10次的文献数。

§ 文献按被引次数从高到低排列,列表提供基本书目信息、被引次数及年代
☆ 点击题名可看详细信息(以他的第一篇文章为例),包括:
1、书目信息
题名可链接到信息来源(一般是某个订购数据库),如果有可直接下载的其他来源(如PDF文件),会在右侧给出链接
2、引文信息:引文年代分面图
下面的“学术文章”同样是链接到信息来源

☆ 点击被引次数,列出所有引用文献──链接到Google学术界面,同样列表右侧会有可直接下载来源(如PDF文件)

———-质量控制(Action)———-
除了三个步骤自动生成引用档案,Google也充分利用人个参与(Action),对档案手工强化。
可执行的操作有:
1、增加
如果之前步骤2没有完成,此时可重新检索后增加。
不能自己添加条目──对Google来说,搜不到的就是不存在的。[update 2012-8-10, 现可选择手工添加]
2、合并
比如以不同语种显示的同一篇。我用英文搜到的是CNKI的英文版,比较奇怪的是同一篇文章的中英文版引用次数不同。
3、删除
比如加入了非自己的文章
4、编辑
点击文章篇名后,可选择“编辑”,修改书目信息,似乎期刊页码错误较多(不改也无大碍吧)。如果合并错了,可在此拆分
在此界面可以看到:
被引文献包括:文章、图书、学位论文、专利、其他
引用来源包括:期刊/会议录/图书

5、导出
格式:BibTex,EndNote,RefMan
这个功能不属于质量控制,但很贴心,也是鼓励个人参与的必备功能吧。只是支持的格式尚待增加。

via 谷奥:学术搜索的 Google Scholar Citations 引文分析服务开放注册 (2011年11月17日)

[update 2012-3-9] 一早收到Google Scholar发来认证单位邮箱的邮件。很久没去访问了,不知道为什么事隔百多天,它才想起来发邮件让我认证。Google后竟然发现自己的早期博文:Google Scholar将取代引文索引? (2004年11月19日)。