存档在 ‘乐此不疲’ 分类

Google学术引用初探

2011年11月19日

Google学术搜索推出引文分析服务,三个简单步骤即可给出一份作者的引用档案(Citation Profile)。以自己做小白鼠,试用了一下。基本结论是,除了数据来源有待开拓,功能强大、操作方便、细节贴心。
数据来源问题,一是作者文献是否收录完整,二是引用来源是否权威,其实对引文分析来说是致命的。后者比较容易解决,如果需要,对引用来源做一个分级,对擅长数据处理的Google来说不是难事。比较困难的是前者,此服务推出,或许会进一步阻碍有类似服务的数据库供应商向其提供信息。比如目前中文来源看到有万方、维普、CNKI和其他零散来源,CNKI会不会担心影响自己的引文数据库?现在来看,与直接在来源数据库搜索的篇数比对,至少维普和CNKI的信息是不完整的。

———-三步操作———-
注册入口

1、建档
提供4项基本信息:姓名、单位、认证邮箱、兴趣领域。
单位和兴趣领域对自动筛选同名作者至关重要。单位邮箱是认证用的,如引文分析报告选择公开,会有认证标识。
2、文章
根据第1步提供的基本信息,自动出现检索结果,可以浏览后直接加入(add)。从我的结果看,没有错误。
由于我建档时提供的是英文信息,检出篇数太少(英文题名)。这时在检索框中改用中文姓名检索,检出较多篇数(中文题名)。结果同样没有错误,全部加入。
在检索结果集中,会出现合作者。由于自己名下会检出自己非第一作者的文章,所以通常不需要在合作者中做筛选。
3、更新
选择自动更新还是邮件告知,应该主要针对公开自己引文分析报告的人。
这一步实际上不需要做任何事情,直接点击去看建成的档案就行了。

在建成的档案页面,可以选择公开自己的档案(先预览──这是必须的)。
以后大概会流行在个人信息(如个人网站、社交网络等)中加入Google学术引用档案了。

———-Google学术引用档案样本———-
Google员工:Anurag Acharya

§ 右侧栏列出合作者:有助了解其学术合作伙伴(建档者可以选择删除某人,这个比较贴心)

§ 除了显眼的引文年代分布图外,引文指数包括所有年代和近5年的两组引文数据:
被引量、h指数、i10指数
根据说明,i10指数指被引至少10次的文献数。

§ 文献按被引次数从高到低排列,列表提供基本书目信息、被引次数及年代
☆ 点击题名可看详细信息(以他的第一篇文章为例),包括:
1、书目信息
题名可链接到信息来源(一般是某个订购数据库),如果有可直接下载的其他来源(如PDF文件),会在右侧给出链接
2、引文信息:引文年代分面图
下面的“学术文章”同样是链接到信息来源

☆ 点击被引次数,列出所有引用文献──链接到Google学术界面,同样列表右侧会有可直接下载来源(如PDF文件)

———-质量控制(Action)———-
除了三个步骤自动生成引用档案,Google也充分利用人个参与(Action),对档案手工强化。
可执行的操作有:
1、增加
如果之前步骤2没有完成,此时可重新检索后增加。
不能自己添加条目──对Google来说,搜不到的就是不存在的。
2、合并
比如以不同语种显示的同一篇。我用英文搜到的是CNKI的英文版,比较奇怪的是同一篇文章的中英文版引用次数不同。
3、删除
比如加入了非自己的文章
4、编辑
点击文章篇名后,可选择“编辑”,修改书目信息,似乎期刊页码错误较多(不改也无大碍吧)。如果合并错了,可在此拆分
在此界面可以看到:
被引文献包括:文章、图书、学位论文、专利、其他
引用来源包括:期刊/会议录/图书

5、导出
格式:BibTex,EndNote,RefMan
这个功能不属于质量控制,但很贴心,也是鼓励个人参与的必备功能吧。只是支持的格式尚待增加。

via 谷奥:学术搜索的 Google Scholar Citations 引文分析服务开放注册 (2011年11月17日)

英国皇家学会数字期刊档案开放获取

2011年11月15日

英国皇家学会上月宣布,其著名的历史期刊档案共6万篇论文,提供永久免费在线访问,其中包括1665年开始发行的世界第一份科学期刊《英国皇家学会哲学学报》(Philosophical Transactions of the Royal Society)。

Royal Society Digital Journal Archive

从学会出版网站看,该数字期刊档案的不同部分原为其各种订购产品所免费附送,包括如下期刊:

√ Physical Sciences Journals Back Archive

√ Biological Sciences Journals Back Archive
√ Notes & Records Journal Back Archive

√ Philosophical Transactions of the Royal Society A: Mathematical, Physical & Engineering Sciences and all previous forms
⊙ Philosophical Transactions of the Royal Society Series A: Physical & Engineering Sciences (1990-1995)
⊙ Philosophical Transactions of the Royal Society of London Series A, Mathematical & Physical Sciences (1934-1990)
⊙ Philosophical Transactions of the Royal Society of London Series A, Containing Papers of a Mathematical or Physical Character(1896-1934)
⊙ Philosophical Transactions of the Royal Society of London A (1887-1895)
⊙ Philosophical Transactions of the Royal Society of London (1776-1886)
⊙ Philosophical Transactions (1665-1775)

√ Philosophical Transactions of the Royal Society B: Biological Sciences and all previous forms
⊙ Philosophical Transactions of the Royal Society of London Series B, Biological Sciences (1934-1990)
⊙ Philosophical Transactions of the Royal Society of London Series B, Containing Papers of a Biological Character (1896-1934)
⊙ Philosophical Transactions of the Royal Society of London B (1887-1895)
⊙ Philosophical Transactions of the Royal Society of London (1776-1886)
⊙ Philosophical Transactions (1665-1775)

√ Proceedings of the Royal Society A: Mathematical, Physical & Engineering Sciences and all previous forms
⊙ Proceedings of the Royal Society of London Series A: Mathematical & Physical Sciences (1990-1995)
⊙ Proceedings of the Royal Society of London Series A, Mathematical & Physical Sciences (1934-1990)
⊙ Proceedings of the Royal Society of London Series A, Containing Papers of a Mathematical and Physical Character (1905-1934)
⊙ Proceedings of the Royal Society of London (1854-1905)
⊙ Abstracts of the Papers Communicated to the Royal Society of London (1843-1854)
⊙ Abstracts of the Papers Printed in the Philosophical Transactions of the Royal Society of London (1800-1843)

√ Proceedings of the Royal Society B: Biological Sciences and all previous forms
⊙ Proceedings of the Royal Society of London Series B, Biological Sciences (1934-1990)
⊙ Proceedings of the Royal Society of London Series B, Containing Papers of a Biological Character (1905-1934)
⊙ Proceedings of the Royal Society of London (1854-1905)
⊙ Abstracts of the Papers Communicated to the Royal Society of London (1843-1854)
⊙ Abstracts of the Papers Printed in the Philosophical Transactions of the Royal Society of London (1800-1843)

检索入口(1665年至今):http://royalsocietypublishing.org/search
按年浏览:Philosophical Transactions of the Royal Society

Via 山人常的日志(书社会):英国皇家学会350年历史论文上线 (2011-11-15)

BBC News Magazine报道:
Strange tales from the Royal Society (25 October 2011)
介绍了若干著名文章

皇家学会科学新闻 The Royal Society–Science News
Royal Society journal archive made permanently free to access (26 October 2011)

各国行业分类标准

2011年3月14日
因为回一封邮件,查了一圈各国的行业分类标准或标准行业分类法(Industry Classification),整理如下。
———-联合国 ISIC Rev.4———-
《所有经济活动之国际标准行业分类》(修订4版)
一级A-U共21类,二级2位数字。见:维基百科
———-中国国家统计局:行业分类标准———-
国民经济行业分类与代码 (GB/T 4754-2002)
这里这里这里都有(都是政府网站)
一级A-T共20类,共4级(4位数字)
———-美国 SIC———-
《标准行业分类》(1937)
一级A-J共10类,共4级(4位数字)。维基百科上有4位数字代码表,并称虽然SIC基本上被NAICS取代,但一些政府部门与机构如美国证券交易委员会(SEC)仍在使用。
———-北美 NAICS———-
《北美行业分类法》(2007版)
北美(美国、加拿大、墨西哥)现在使用的标准,维基百科上有一级2位数字共20类。1997年初版,最新版2007。
———-英国 UK SIC(92)———-
《英国经济活动标准行业分类》(2003最新修订)
一级A-Q共17类,最小5级(如01.42/9)
———-道琼斯和富时 ICB———-
《行业分类基准》
Industry Classification Benchmark
维基百科有4级分类表
———-日本標準産業分類(平成19年11月改定)———-
在首页选择:分類検索システム(分类检索系统)
可选择以下几项逐级浏览(也可检索):
日本標準産業分類(一级A-T共20类,到4级4位数字)
日本標準商品分類(一级10类)
経済センサス産業分類(一级A-R共18类)
———-小结———-
1、行业分类,大同小异。
2、形式上:基本都采用数字。即使字母作为一级类,二级以下类也只用数字,而不是字母+数字形式。与《中国图书馆分类法》或《美国国会图书馆分类法》LCC不同。以中国标准为例:
一级:A农、林、牧、渔业
二级:01农业
英国UK SIC是唯一采用十进制形式的,从第三级开始加小数点,第5级加/(如01.42/9),与《杜威十进分类法》DDC三位数后加点也不同。

CNKI知识搜索

2011年3月9日
今天一朋友说知网的“图形搜索”和“表格搜索”挺好的,问是不是还有类似的细化搜索数据库。很惭愧的是,自己一直习惯于从图书馆订购入口使用CNKI,特别入口的,除了引文数据库,不记得以前用过有“图形搜索”和“表格搜索”的CNKI知识搜索
CNKI知识搜索包括以下9种垂直搜索,检索范围为CNKI收录文献全文(除“学术资源”):
1 文献搜索:精确完整的搜索结果、独具特色的文献排序与聚类,是您科研的得力助手
2 学术定义:写论文需要引用权威的术语定义怎么办?CNKI学术定义搜索帮您轻松解决
3 数字搜索:“一切用数字说话”,CNKI数字搜索让您的工作、生活、学习和研究变得简单而明白
4 学术趋势:关注学术热点,展示学术发展历程,发现经典文献,尽在CNKI学术趋势
5 翻译助手:文献、术语中英互译的好帮手,词汇句子段落应有尽有
6 学术资源:全面的学术资源网站导航
7 图形搜索:各专业珍贵的学术图片,研究成果和复杂流程的直观展现
8 表格搜索:各专业珍贵的学术图表,为您汇总、对比各类信息数据提供方便
9 工具书馆
以“元数据”为检索词试用,以下按可用性排序:
7 图形搜索/8 表格搜索:搜索范围是图表标题与文献标题(篇名),这个范围应该是合理的。搜索结果直接显示(图形是小图,点击后为大图),没有登录要求。有文献出处与页码(非图表页码),效果不错。
4 学术趋势:像Google趋势一样显示搜索词的在1996-2008年的相对量,右侧显示“热点年份相关高频被引文章”及“热点月份相关高频浏览文章”,对了解受关注文献很有用。可惜数据只到2008年。
9 工具书馆:可查词条、词目,针对的是辞典、百科全书、年鉴、标准、图录等工具书,显示词条片断,标明来源。阅读全文需要订购。
1 文献搜索:缺省检索“主题”,也可在全文、标题、关键字、作者及摘要中检索,可以按相关度、被引次数、下载次数及时间排序,可限定来源数据库(期刊、学位论文、会议、报纸、科技成果、专利、标准)和学科分类。可用,不过没发现比总库更好用。
6 学术资源:像很多学科导航一样,没有可持续性
2 学术定义/5 翻译助手:一直进不去,没用成。记得以前曾经在搜索引擎里碰到过,与图表搜索类似,是从CNKI收录文献中抽取片断。
3 数字搜索:似乎只要全文中检索词所在段落有数字都会命中,可用性存疑。在600条命中记录中,数字大多不具有检索意义,当然也许是使用“元数据”检索本身不合理。无意义的结果包括:文章作者单位邮政编码(大概与摘要算做同一段落)、提及的本文小节号、参考文献编号等。
网站下面标的是2008,看“学术趋势”的数据也只到2008年,难道CNKI知识搜索是一个被废弃了的园子?

《古今图书集成》网络版

2010年12月21日
    《古今图书集成》可以在CADAL(大学数字图书馆国际合作计划)的“古籍”部分查到并公开访问全文,实为中华书局影印本。
    今天看到《中国索引》2010年(第8卷)第4期载文“《古今图书集成索引》网络版推出”(p.60),前往一观。
    广西大学古籍整理研究所的《古今图书集成·索引&全书图像》,不但可以公开访问全文图像,还可以通过索引定位内容。
    “網站所擁有的全書圖像來自對1934年中華書局武英殿本影印本的掃描,本站所使用的索引自1984年我們開始編製《古今圖書集成索引》起,經歷了油印本(1984年,80萬字,三大本)、印刷本(1988年,275萬字,中華書局和巴蜀書社出版)、電子版1.0版(1998年,1200萬字,金海灣電子音像出版社和廣西師範大學出版社聯合出版)、電子版2.0版(2007年,3800萬,光盤版,待出版;2009年網絡版)等四個階段。索引數據不斷擴充完善。”上述文章称2010年制成网络版,网站留言最早是2010年4月。
    真是四分之一世纪的用心之作!采用传统索引方式,除“经纬目录”外,“索引部分建立52个标目式多字段索引,合计1189013条记录,共38359673字”。52个索引分别对应于图表类、列传类、引书类、文学艺术类、天文类、历史古籍类、行政区划类、医药卫生类、经济类、生物类、宗教类,适合精确检索
    默认为繁体字版,输入简体字检索无结果;可切换到简化字版。查到后直接点击可看全文图像。
    试用后感觉应当引入一些现代元素。目前索引已有近4千万字,与全文1亿7千万字相比已在一个数量级上,如能配上全文检索,则可兼备查全与查准。退而求其次,也可不分索引类型,提供全字段检索,降低使用门槛、扩大用户范围,使没有很多古籍知识背景的人,也能从中《古今图书集成》这样的大型类书中挖掘出可资利用的资料。
    另:网上有台湾的《故宮東吳數位古今圖書集成》的演示版,故宫博物院与东吴大学合作出品,依据底本是“故宮典藏的雍正四年銅活字版掃瞄而得的五十四萬張圖檔”,“數位內文一億七千萬字”,演示版“放了《古今圖書集成·曆象彙編》四個分典,專供網路測試之用”。查询结果为当页文字,无图像。
    该产品由汉珍数位图书股份有限公司经销,据称“市面上已經有兩種類似產品,正向各單位兜銷中。甲產品出自我們委託代工輸入的公司,再多辯解,也無法避免侵犯我們權益之嫌。乙公司的資料購自大陸盜賣我們的資料,缺字與圖像都沒有就上市。”确实也查到另两家产品。明明是岛内问题,怎么也扯上大陆?
    据维基百科“古今图书集成”条目:
⊙本書編成後,於雍正四至六年(1726年至1728年)由清內府用銅活字排印成64部(未計試印本樣本1套),稱「銅字版」,至今僅存十餘部,在國家圖書館與台灣故宮博物館皆有藏。
⊙民國23年(1934年)上海中華書局據康有為所藏雍正銅活字本影印之縮印線裝裝訂808冊(後8冊為考證),稱「中華版」,於1940年出齊,是迄今最通行之版本。
⊙1999年起該全書在台灣以雍正銅字版(書藏故宮博物館)為藍本製作電子化版本(由東吳大學中文系負責)出售。
———-《中国索引》的分割线———-
中国索引学会网站有历年《中国索引》OA(发布略有延迟,目前最新为2010年第1期)。