Google学术引用初探

Google学术搜索推出引文分析服务,三个简单步骤即可给出一份作者的引用档案(Citation Profile)。以自己做小白鼠,试用了一下。基本结论是,除了数据来源有待开拓,功能强大、操作方便、细节贴心。
数据来源问题,一是作者文献是否收录完整,二是引用来源是否权威,其实对引文分析来说是致命的。后者比较容易解决,如果需要,对引用来源做一个分级,对擅长数据处理的Google来说不是难事。比较困难的是前者,此服务推出,或许会进一步阻碍有类似服务的数据库供应商向其提供信息。比如目前中文来源看到有万方、维普、CNKI和其他零散来源,CNKI会不会担心影响自己的引文数据库?现在来看,与直接在来源数据库搜索的篇数比对,至少维普和CNKI的信息是不完整的。

———-三步操作———-
注册入口

1、建档
提供4项基本信息:姓名、单位、认证邮箱、兴趣领域。
单位和兴趣领域对自动筛选同名作者至关重要。单位邮箱是认证用的,如引文分析报告选择公开,会有认证标识。
2、文章
根据第1步提供的基本信息,自动出现检索结果,可以浏览后直接加入(add)。从我的结果看,没有错误。
由于我建档时提供的是英文信息,检出篇数太少(英文题名)。这时在检索框中改用中文姓名检索,检出较多篇数(中文题名)。结果同样没有错误,全部加入。
在检索结果集中,会出现合作者。由于自己名下会检出自己非第一作者的文章,所以通常不需要在合作者中做筛选。
3、更新
选择自动更新还是邮件告知,应该主要针对公开自己引文分析报告的人。
这一步实际上不需要做任何事情,直接点击去看建成的档案就行了。

在建成的档案页面,可以选择公开自己的档案(先预览──这是必须的)。
以后大概会流行在个人信息(如个人网站、社交网络等)中加入Google学术引用档案了。

———-Google学术引用档案样本———-
Google员工:Anurag Acharya

§ 右侧栏列出合作者:有助了解其学术合作伙伴(建档者可以选择删除某人,这个比较贴心)

§ 除了显眼的引文年代分布图外,引文指数包括所有年代和近5年的两组引文数据:
被引量、h指数、i10指数
根据说明,i10指数指被引至少10次的文献数。

§ 文献按被引次数从高到低排列,列表提供基本书目信息、被引次数及年代
☆ 点击题名可看详细信息(以他的第一篇文章为例),包括:
1、书目信息
题名可链接到信息来源(一般是某个订购数据库),如果有可直接下载的其他来源(如PDF文件),会在右侧给出链接
2、引文信息:引文年代分面图
下面的“学术文章”同样是链接到信息来源

☆ 点击被引次数,列出所有引用文献──链接到Google学术界面,同样列表右侧会有可直接下载来源(如PDF文件)

———-质量控制(Action)———-
除了三个步骤自动生成引用档案,Google也充分利用人个参与(Action),对档案手工强化。
可执行的操作有:
1、增加
如果之前步骤2没有完成,此时可重新检索后增加。
不能自己添加条目──对Google来说,搜不到的就是不存在的。[update 2012-8-10, 现可选择手工添加]
2、合并
比如以不同语种显示的同一篇。我用英文搜到的是CNKI的英文版,比较奇怪的是同一篇文章的中英文版引用次数不同。
3、删除
比如加入了非自己的文章
4、编辑
点击文章篇名后,可选择“编辑”,修改书目信息,似乎期刊页码错误较多(不改也无大碍吧)。如果合并错了,可在此拆分
在此界面可以看到:
被引文献包括:文章、图书、学位论文、专利、其他
引用来源包括:期刊/会议录/图书

5、导出
格式:BibTex,EndNote,RefMan
这个功能不属于质量控制,但很贴心,也是鼓励个人参与的必备功能吧。只是支持的格式尚待增加。

via 谷奥:学术搜索的 Google Scholar Citations 引文分析服务开放注册 (2011年11月17日)

[update 2012-3-9] 一早收到Google Scholar发来认证单位邮箱的邮件。很久没去访问了,不知道为什么事隔百多天,它才想起来发邮件让我认证。Google后竟然发现自己的早期博文:Google Scholar将取代引文索引? (2004年11月19日)。

重写RDA文字编辑确定

在6月发布的《美国RDA测试协调委员会报告与建议》中,对RDA开发联合指导委员会(JSC)的首要建议(1.a)就是“与CoP协作,确定并聘用写手,承担以清晰、无歧义、浅显的英语重写RDA用法说明的任务”,要求的时间是3个月。在8月举行的RDA主管机构负责人委员会(CoP)会议对《建议》基本上是全盘接受。
上周ALA出版社宣布已选定Chris Oliver作为文字编辑,承担改善RDA可读性的任务,即重写不改变指引的含义与意图。优先重写章节(建议1.b)在9月已经确定(The Plan for the Rewording of RDA and the Role of the Copy Editor),改写工作已经开始,将按照《建议》的时间表(1.c)于2012年6月完成五章的重写(第9, 10, 11, 6, 17)。按计划,全部章节当于2012年底完成。

Oliver女士任职于麦吉尔大学图书馆,现任加拿大编目委员会主席。曾为JSC的格式变化工作组( Format Variation Working Group)成员,以及RDA延伸小组(RDA Outreach Group)主席,真正是从早期就参与RDA的开发工作。2010年7月,出版了最早的RDA入门性专著:Introducing RDA: A Guide to the Basics。

via RDA blog: Chris Oliver Chosen to Copy Edit RDA (11 Nov 2011)

参见:
RDA可能的修改及时间表(2011年6月22日)
RDA近期走向(2011.8) (2011年9月6日)

DuraSpace发布开源云服务DuraCloud

DuraSpace于11月1日正式发布开源云服务DuraCloud,项目部分受美国国会图书馆的全国数字信息基础设施与保存项目(NDIIPP)资助。
介绍显示(What is DuraSpace),其背后使用三家云服务商──Amazon Web Services, Windows Azure, RockSpace。
DuraSpace项目开源,但提供基于订购的服务。有三种不同价格的服务计划(Pricing):
1、基本存档与保存(年费$4500):免费存储量500GB,不可增加
2、基本媒体访问(年费$4500):免费存储量500GB,不可增加
3、专业(年费$7000):免费存储量1000GB,增加费用$1.00/GB/年
第1种的功能:联机备份与同步,Web访问,文件格式识别,标签,访问多个存储云,通过Web上下载内容,联机共享,文件健康检查。
第2种在第1种基础上增加功能:流媒体,图像浏览,图像转换
第3种在第2种基础上增加功能:在多个云服务商处联机备份与同步

目前已有麻省理工学院、哥伦比亚大学、西北大学和莱斯大学签约使用其托管的云服务以保护数字资源。但尚未见到上线产品,也没有演示。可以申请试用帐户(Trial Account Request),需参加在线培训课程,每月有限额,估计不易申请。

———-背景———-
2009年5月,两大开源机构库软件Fedora和DSpace合并成立DuraSpace,提出云产品DuraCloud(http://duraspace.org/duracloud.php):
向学术图书馆、大学及其他文化遗产机构提供其数字内容的永久访问服务
存储交由专业存储提供者
DuraSpace提供确保长期访问和便利使用的功能,包括:
· 访问 access
· 保存 preservation
· 再用 re-use
· 云内容分享 sharing of cloud content

2009年7月,美国国会图书馆与DuraSpace合作进行为期一年的试验,使用云技术永久访问数字内容。其他参与机构有纽约公共图书馆和生物多样性遗产图书馆。未注意结果如何。

———-消息的分割线———-
Via Library Technology Guide: DuraSpace launches open-source cloud service (November 1, 2011)
官方消息(November 1, 2011)
DuraSpace Launches Open-Source Cloud Service
 会议上的介绍(October 18, 2011)
DuraSpace Offers Open-Source Cloud Service for Academia
正式发布前于10月19日在EDUCAUSE会议上的报告《使用云存档与保存学术记录:来自DuraCloud试验项目的经验》(Using the Cloud to Archive and Preserve the Scholarly Record: Experiences from the DuraCloud Pilot)

———-参见———-
“云计算与图书馆”会议参会记 (2009年9月25日)之:云计算@图书馆 (PPT, p.23-24)

圖書館觀點:Fedora + DSpace = DuraSpace (15th May 2009)

News from the Library of Congress: Library of Congress and DuraCloud Launch Pilot Program Using Cloud Technologies to Test Perpetual Access to Digital Content (July 14, 2009)
译介:美国国会图书馆和DuraCloud发起试验计划——利用云技术进行数字内容永久存取的情况