中国索引协会上海工作站培训会参会记

今天去上海交通大学出版社参加中国索引学会上海工作站成立后的首次培训会。

“索引、数据分析和评价”培训研讨会通知 (2018-5-26)

受邀在会上作个报告。在要求的主题范围内,报了“国际图联图书馆参考模型及其应用”的题目,设想与“索引”做些结合。第2天看到会议主题,因为觉得和LRM完全不搭,索性放松心情、专注讲LRM,不必很辛苦地班门弄斧。准备时以受众完全不了解FRBR为前提,在概述LRM的基础上,特别详细分析了新实体Nomen。在应用部分一是简介了RDA根据LRM的修订,用了昨天刚上线的RDA Toolkit测试版网站的截屏;二是以本馆开发中的“异构数字方志集成平台”作为3层FRBR化目录的实例。很高兴得到一些正面的反馈。

会议4个报告,个人特别感兴趣的是下午北京印刷学院王彦祥教授的“索引编制的途径与技巧”,因为4月份上海工作站成立会上听王教授讲过他的索引编制经历,很想详细了解他的编制方法和编制软件。2个多小时的内容,虽然实际编制的介绍不多,但加上问答环节,基本上了解了王教授的书后索引编制方法。王教授接下来3天(2018.6.16-18)将在复旦为研究生开设系列化索引课程,感兴趣者可前往旁听。详见:2018年索引编制培训
听完王教授报告后最直接的感受是,如果事先了解编制情况,就不会完全放弃自己最初以索引作引子讲LRM的设想了。

中国索引学会今年最大的事就是2018国际索引联盟峰会将于10月17-20日在上海举行。下午会前,王兰成教授来推广会议网站,并希望大家注册投稿:http://www.indexers.cn 或http://cnindex.allconfs.org

最后,不得不称赞会议团队的高效率。下午会议结束没多久,图文并茂的详细报道就在上海高校图书情报工作研究微信公众号上发布:
“索引、数据分析和评价”培训研讨会在上海交通大学出版社举行(2018-6-15)

——— 题外话:微信阻碍信息自由流动 ———
微信时代,搜索引擎竟然查不到会议信息,因为消息是发在微信公众号上的。这是我不喜欢微信的主要原因。虽然我花不少时间看微信上的信息,但我不会在上面开公众号,即使公众号的受众会远多于博客。因为微信就是个封闭的大谷仓,阻碍信息的自由流动。Web 2.0/Lib 2.0虽然已是久远年代的往事,但我心依旧。

RDA工具包测试版网站上线及初步印象

RDA工具包测试版网站2018年6月13日晚上线(北京时间今天上午),工具包网站首页(rdatoolkit.org)侧栏有明显链接(Explore Toolkit Beta Site),工具包本身页面(access.rdatoolkit.org)顶部也有不太明显的链接。
访问网址:RDA Tookit Beta Site
登录测试版网站可以用当前网站的订购帐号和口令,也可以用第2层的个人profile名与口令,无需双重登录。在订户IP范围内,今天上午未登录也可访问(下午需要登录)。如未订购,可申请30天免费试用测试版网站。

根据前几天公布的RSC主席Gordon Dunsire有关3R计划成果的文档(链接见下),此次的测试版实际是未完成版,因此测试版内容只是草案,直到RSC和RDA理事会批准完成版,同意3R计划完成,时间估计在2018年底
该文档也概要介绍了RDA的变化。因为变化实在太多,会在适当时候在网站RDA Reference部分提供所有变化的细节,包括RDA实体、元素和词表编码方案。

初步印象:
1、四大栏目
(1)实体(Entities):主要条款,基于《国际图联图书馆参考模型》(IFLA LRM)的13个实体展开
(2)指导(Guidance):通用条款
(3)政策(Polices):各家政策声明(目前仅有英美两家)
(4)资源(Resources):原来附录的内容
2、条款编号:取消。整个体系基于IFLA LRM的实体展开。属性和关系列在各实体下,链接到各自页面。由于只有13个实体,因此每个实体下属性和关系超多,设置滚动框。好在可以检索查找。
3、元素参考:元数据词表定义(IRI、定义域、值域、替代标签等);并关联用户任务、记录方法、MARC21字段等。
特别是标识:采用RDA注册标识,如:http://rdaregistry.info/Elements/w/P10065(creator of work)。相应的网址也具有识别性,如:http://beta.rdatoolkit.org/RDA.Web/Content/Index?externalId=en-US_rda_creator_of_work。并不是官方曾在RDA-L中说的一长串供机器识别的无意义字符(也许在底层保存时采用)。
4、样例:很少见到。光看文字描述,要理解怎么用有时并不容易。这部分还有很多工作待做。
5、选项(Option):取代了原来名目不一的变化做法(交替、例外、可选增加、可选省略)。形式上也统一采用条件语句(For)说明使用范围。
6、网页翻页:页面下部前后翻页规则不明。比如creator of work前一页coverage of content,后一页criminal defendant corporate body,有点莫名其妙。如果没有意义,不如取消。

关于条款编号取消,之前就有公布。没想到上周末公布测试版上线时,在RDA-L邮件组引起了相当大的反弹,反对者的主要理由是不方便引用,反对者中教编目的老师占相当比例。当然也有说不妨看了测试版再说,或者明确支持的。
我也属支持一派。之前RDA因为修订改变条款号甚至与旧号冲突的情况并不少见,而讨论与写作中引用元素名显然更稳定、也更方便理解。在内心感觉取消的只是大条款号,在元素内部还是会保留一部分的。因此特意关注了下,初步结论是,即使元素内部,大多没有编号(比如有多个选项时)。想到了团体作为创作者,有8种情况,总该有编号了吧?这个规则会在哪个元素中出现呢?先试了团体实体,没有,还是在作品的创作者(creator of work),确实有1-8的编号。

相关资料:
公告:RDA Toolkit blog: What to Expect from the RDA Toolkit Beta Site (2018-6-6)  特别说明不再有PDF版(离线保存利器)
使用介绍:RDA Toolkit Beta Site is Here (2018-6-13) / James Hennelly (Director, RDA Toolkit)
内容介绍:Outcomes of the RDA Toolkit Restructure and Redesign Project (2018-6-8) / Gordon Dunsire (RSC Chair). RSC/Chair/19
关于取消编号的讨论:[RDA-L] News on the RDA 3R Project beta release (2018.6.8- )

期刊被引排名CiteScore 2017发布

Elsevier日前发布Scopus最新期刊被引排名CiteScore 2017。收录期刊超过23350种,号称比竞争对手多12000种,并且排名数据还免费获取。
via: Don’t speculate—validate. Let CiteScore™ metrics guide you to the right journals.

CiteScore 是Scopus版的影响因子,只是分母为前3年(而非2年)发文总数。同时,所有文献类型都包含在 CiteScore 的计算中(科研论文、评论文献、会议文件、社论、更正、注释以及简短调查)。
计算方法:某刊当年被引次数/某刊前3年发文总数。本次发布的期刊CiteScore值=2017年被引次数/(2014-2016发文总数)。
与影响因子相比,分母显然偏大(年份长、文章类型多),同时由于收录期刊多1倍左右,分子也会有所增加,因而最终值与影响因子相比具有不确定性。

因为是免费的,可以自行到Scopus网站的“来源出版物” 详细探索各种排名信息。
也可下载“Scopus来源出版物列表”,有37500余种期刊(含已停刊)本身及排名的详细,包括2015-2017年CiteScore数据。
网站清单页面所列信息包括:刊名,CiteScore,最高百分位(及学科前1%排名位置),2017年被引数,2014-16年发文数,发文被引比例,SNIP 。
点击刊名可以看详情。数据每月更新,现在已有CiteScore 2018值(因为只有不到半年的引用数据,自然比2017低很多)。
要访问任意期刊的“来源出版物详情”页面,可使用上述下载列表中的Sourcerecord id:https://www.scopus.com/sourceid/XXXXXX

外行看热闹。根据信息图看个大概:CiteScore metrics infographic (PDF, 60.9 KB)
收录活跃期刊23,359【“来源出版物”页面显示目前有25,322种】,其中1,477种较2016年CiteScore值增加1倍以上,14,092种增加或持平【换言之,约9千种CiteScore值下降】
比WOS收录期刊多12,000种,其中有490多种在本学科领域前10%的期刊未出现在2016期刊影响因子(Journal Impact Factor)中【严重挑战WOS的核心期刊选择】
学科330个,其中最大的“社会学和政治学”有1028种期刊;前10%期刊共2942种【有些期刊属于多个学科】
有31种OA期刊在该主题领域排名第1
有6种期刊新加入Scopus,首次进入CiteScore即位列前1%(同时也是本学科领域前1%)【信息图中列出】
有22种刊发文100%被引【从“来源出版物”看目前有27种。总体来说都是发文较少的:有5种3年发文仅1篇、另10种也在个位数、最多71篇。其中OA的有8种】
– 最高指标值
1、被引和发文最多:PLOS One 被引255,196/发文84,900=3.01PLOS One竟然算一份刊,数值之大不忍直视。虽然其CiteScore值有逐年下降趋势。目前在主题领域General Agricultural and Biological Sciences中排名16(91%),在General Biochemistry, Genetics and Molecular Biology中排名42(77%)】
2、CiteScore,CNIP,SJR最高:Ca-A Cancer Journal for Clinicians
CiteScore=130.47【当年被引数是前3年发文数的130倍;该刊2014-2016发文130篇,2017年被引16961次,被引文章占所有文章70%】
SNIP=88.164;SJR=61.786

更多关于CiteScore:Identifying and understanding research impact

——— 指标值说明 ———
CiteScore
衡量期刊所发表文献的平均受引用次数。
当年被引次数/前3年发文总数

SNIP (Source Normalized Impact per Paper)
每篇文章的经过标准化的来源出版物影响:将实际受引用情况对照期刊所属学科领域中预期的受引用情况进行衡量。【说明不同主题领域的引用潜力】
journal’s citation count per paper ÷ citation potential in its subject area
某刊每篇文章被引数/本学科领域的潜在引用

SJR (SCImago Journal Rank)
SCImago 期刊等级:衡量经过加权后的期刊受引用次数。引用次数的加权值由施引期刊的学科领域和声望 (SJR) 决定。
average # of weighted citations received in a year ÷ # of documents published in previous 3 years
一年中收到加权引文的平均数/前3年发文数