替代计量学(Altmetrics)备记

对新兴的Altmetrics,一直是只知其名、未看其实。此次会议听到EBSCO要把它纳入对检索结果的排序,有了点兴趣。
查些资料大致看了一下,用到的那些国外网站,对中文基本不适用。本国有类似网站的,是否可以方便获取相应数据则不可知。仅在此备记。
看到已有中文论文发表,未参考。

Altmetrics=Alternative metrics,译名待定。据说武夷山老师曾将其译为“社媒影响计量学”或“补充型指标计量学”(翟自洋:由信息计量学新词altmetrics的翻译想到的),我把它译为“替代计量学”或“替代测度”(不同情况下使用)。因为altmetrics最初针对的是引文之外的社会媒体,只是引文测度的补充,而现在通常也把传统的引文测度纳入其中,已有取而代之之意。当然,对引文之外的其他影响如何计量,似还没有成熟的指标。
说起来altmetrics这样非独立、依赖参照系而存在的术语,恐怕终究是要改变、或者重新定义为其他词的缩写的。

维基百科Altmetrics词条的定义:一种新的测度,作为广泛采用的期刊影响因子和个人引用指标如h指数的替代(交替)。本术语2010年提出,作为一般化的文章级测度。……也可用于人、期刊、图书、数据集、演讲、视频、源代码库、网页等。不仅包括引用数,也包括作品影响的其他方面,如多少数据与知识库指向、文章浏览、下载、在社会媒体与新媒体中提及。

altmetrics: a manifesto
altmetrics.org网站上的Altmetrics宣言,v1.01,2011.9.28。2010.10.26 v1.0版时用的是alt-metrics。

此图代表2010-2011年altmetrics/alt-metrics初始时认识,现在使用、引用均已纳入altmetrics计量,真有“替代”之意。
网站列出如下工具(Tool
ImpactStory:https://impactstory.org/(无法访问)
ReaderMeter:http://readermeter.org/(Alpha版,2010,网站仍在、似未更新)
ScienceCard:http://sciencecard.org/(2011-2012.4,已停止,网站首页推荐PLOS Article-Level Metrics等4家)
PaperCritic:http://www.papercritic.com/(版权显示2011-2012)
Crowdometer:http://crowdometer.org/(无法访问)
(另:维基百科提到CitedIn:http://www.citedin.org/,目前仅有jQuery UI页面)

PLOS Article-Level Metrics的Altmetrics页面提及的工具:
Impact Story
Altmetric.com
Plum Analytics
ScienceCard
ReaderMeter
PeerEvaluation:http://www.peerevaluation.org/(2010-2012,面向个人,注册登录后使用)
Research Scorecard:http://researchscorecard.com/(2009,博客最后更新2010.1.8)

总结一下,现在活跃的服务不多。大致上对个人免费,对机构收费(Altmetric对图书馆员也免费);[update 2014-6-3: ImpactStory代码开源]。一些评价指标的详细信息:
ImpactStory的五个类别(无法访问,引自维基百科Altmetrics
浏览:HTML浏览与PDF下载
讨论:期刊评论、科学博客、维基百科、推特、脸书及其他社会媒体
保存:Mendeley, CiteULike及其他社会书签
引用:学术文献中引用,追踪Web of Science、Scopus、CrossRef及其他
推荐:如F1000Prime所用例子

– Plum Metrics的五个测度类别
使用:下载、浏览、馆藏、馆际互借、文献传递
抓取:喜欢、书签、保存、阅读器、分组、待看
提及:博文、新闻专题、维基百科条目、评论
社会媒体:推文、Google+的+1、赞、分享、评分
引用:PubMed、Scopus、专利
(Current List of Metrics列出所有使用的网站及测度内容)

– PLOS Article-Level Metrics的影响指标
使用:PLOS浏览、PDF下载、XML下载,PMC浏览、PDF下载
引用:PubMed Central、CrossRef、Scopus、Web of Science
社会书签与发布活动:CiteUlike、Mendeley、推特、脸书
媒体与博客覆盖:Nature博客、ScienceSeeker、研究博文、维基百科、引用通告(trackbacks)
讨论活动与评级:PLOS的评论、注释、评级

– Altmetric没有查到,列下它提供的四种工具
网页浏览、小书签(Bookmarklet)、API、网页嵌入(Badges)
可看下PLoS Impact Explorer:PLoS演示版

[update 2014-6-3] Elsevier的电子刊Library Connectaltmetrics专题

[update 2014-6-11] NISO Alternative Assessment Metrics (Altmetrics) Project 是2013年7月得到斯隆基金资助的项目,现正为白皮书 NISO Altmetrics Standards Project White Paper 公开征求意见(截止日期2014年7月18日)

[update 2014-6-21] Altmetrics Bibliography / Charles W. Bailey, Jr.
含英语文章与技术报告,不含图书与会议录。导言中引用的altmetrics定义(来自:”The Altmetrics Collection,” Jason Priem, Paul Groth, and Dario Taraborelli)
Altmetrics is the study and use of scholarly impact measures based on activity in online tools and environments. The term has also been used to describe the metrics themselves—one could propose in plural a “set of new altmetrics.” Altmetrics is in most cases a subset of both scientometrics and webometrics; it is a subset of the latter in that it focuses more narrowly on scholarly influence as measured in online tools and environments, rather than on the Web more generally.
via 武夷山(博客):有人系统整理了网媒影响计量学的相关文献(2014-6-19)

“2014高校图书馆发展论坛”记录

前几天在西安参加“2014高校图书馆发展论坛”,会议主题“数字资源——用数据量体 为学科裁衣”。两天时间中,主会场、分会场共43个报告,可以看出两大热点,各占约1/3:
一是机构知识库(9个+科学数据管理1个)与开放获取(4个)
二是数据统计分析(13个+数字资源违规使用防控1个)

对于机构知识库,自己一直在旁观,总觉得要做一个不只是图书馆一厢情愿、自娱自乐的东西不容易:目的是什么?能做到什么程度?起到什么作用?此次由于时间冲突,只能选听几个报告:
1、平台方面,开幕式上知先的广告确实吸引眼球。一方面,在资料入库上,能够自动抓取机构成果、自动检测代表性成果、生成引用报告;另一方面,在用户服务上,个人成果一键上传、自动发送引用通知,还具有团队知识库,可以一键分享(钱建立:让机构知识库从“庙堂”演化为“书房”)。理念不错,功能实现到何程度,有待考察。
西安交大的系统也是由图书馆提需求、厂商开发,实现与外部数据共享与推送(张雪蕾:机构知识库与外部数据共享集成)。
相对而言,比较“亲民”的是北邮的,参加Calis三期机构知识库项目,对DSpace进行各种本地化改造,强化个性化功能(颉夏青:社交推荐,让机构知识库“活”起来)。这位MM的PPT也做得相当好。
2、设计本地政策方面,以下3个报告可参考:潘卫:中国机构知识库用户调查及思考;张冬荣:机构知识库内容存缴的激励机制与措施;顾立平:科学数据管理与数据资源建设中的权益问题与解决方案
3、开放获取方面,北大图书馆开始进入学术出版领域(周义刚:北京大学期刊网的建设与思考)。

自己对数据统计分析也有兴趣。近年本馆在做纸本资源利用统计,电子资源方面馆内使用统计只是采用厂商提供数据,无法做到按使用者统计。本次同样由于时间冲突,也只能选听几个报告:
1、数字资源利用统计方面,西交大和复旦的以前略有了解,这次就没打算听。没料到的是,只听了清华的,就觉得没必要再了解如何做了——以清华的实力,在做了9年之后打算购买商业软件……(邹荣:数字资源访问管理系统的实践与思考)。[update 2014-6-1] 西安交大邵晶副馆长在某分会场提问环节中称,国外数据库提供的利用统计数据与他们统计结果差别不大(10%左右),但有的国内数据库厂商提供的数据要差数倍,应该是没有遵循COUNTER标准。
2、统计管理方面,上交大报告,我打算推荐给本馆负责统计工作的同事(徐璟:图书馆业务数据统计与管理优化实践
3、altmetrics概念还很新,EBSCO已经收购了做网络研究影响分析的Plum Analytics(刚查了新闻发布是2014.1.15),“引用数据是滞后指标”,而网络影响才是即时的。匹兹堡大学机构知识库已经用上了PlumX:D-Scholarship@Pitt(刚又查到:PlumX被Library Journal评为2013年度Most Ambitious Database,其中称2位创建人领导团队开发了Summons,有意思)。据称EBSCO正利用altmetric提高学术结果排序,这对它的发现系统EDS是好消息么?(公丕俭:使用传统与网络计量,即时有效促进学术对话与交流)。
4、RFID,越来越多土豪馆开始采用。在纸本利用逐年下降的情势下,我对其必要性一直存疑。华中师大申请了一项利用RFID收集现刊利用数据的专利(实用新型)——如此才能体现RFID不同于条码的优越性(李玉海:基于用户行为数据的馆藏资源配置与利用评估模型)。
5、最后给本馆的报告做下广告(李欣:数据挖掘助力服务创新

本人的报告属于其他1/3难以归类之列,主要介绍RDA的进展与现状,题为:RDA:从内容标准到元数据标准
(大部分报告应该会在会议网站上挂出,有需求者可耐心等待)
[update 2014-6-10] PPT已经挂出,标明不公开的有14个,占三分之一,其中程焕文馆长没有PPT。数据统计分析的报告绝大部分不公开;比较意外的是分论坛六“国家、教育部课题汇报”,五个中竟然有三个不公开。
[update 2015-4-16]程焕文馆长报告见《图书馆论坛》2015年第4期第1-8页:在“纸张崇拜”与“数字拥戴”之间——高校图书馆信息资源建设的困境与出路

[update 2014-6-1]会议相关报道
2014年中国高校图书馆发展论坛隆重开幕
分论坛一:校企精英献策图书馆数字资源发展规划
分论坛二:百家争鸣机构知识库建设
分论坛三:“数字资源监控”报告集锦
分论坛四:图书馆数据挖掘、数字资源组织建设经验分享
对本人报告的介绍:“……从元数据标准类型切入,介绍了RDA发展进程、内容标准和元数据标准。以美国RDA实施进程为例举例说明,简单介绍了大陆RDA采用情况。随后分享了RDA如何从内容标准转变为元数据标准。介绍了2014年1月发布的元数据元素的类和属性。交流了使用RDF三元组元素集例和RDA注册起到的取代MARC和其他数字图书馆应用的作用。”
分论坛五:“数字资源平台建设”主题报告集锦
分论坛六:聚焦课题汇报 服务学科教研
闭幕式报告:朱强馆长:图书馆的数字化转型已经开始,但远未完成
“头脑风暴 资源为王”2014高校图书馆发展论坛闭幕

下一代图书馆服务平台的前世今生

先来一段八卦,关于图书馆自动化系统年度报告,有关下一代图书馆服务平台的信息均来自于此。

Marshall Breeding自2002年起,每年在4月1日的《图书馆杂志》(LJ, Library Journal)上发表年度“自动化市场”报告(Automation Marketplace),分析总结前一年图书馆自动化系统状况,美国为主,兼及那些大厂商的国际市场。
今年4月1日,LJ没有发表该报告,却于4月10日在旗下网站The Digital Shift发表一文:
Putting the Pieces Together | Library Systems Landscape / By Matt Enis on April 10, 2014
该文概述今年报告的内容,仍沿续以前诸年报告样式。其中称LJ的年度“自动化市场”专栏将改名“图书馆系统风景线”(Library Systems Landscape),今年为第1版。
4月15日,Marshall Breeding在American Libraries上发表“2014图书馆系统报告”(Library System Report 2014,也沿续以前诸年报告样式,只是改了标题。原来他在2012年5月变身独立咨询人(independent consultant)后,年度报告今年改换门庭了。(另:2014年报告中提到Kuali OLE时,还特别加了个免责声明,说明自己曾在2008-2009年参与OLE的最初计划项目。印象中以前没有这样的声明,不知是否与他改变了图书馆员身份有关)

参见:Library Technology Industry Reports
Marshall Breeding在他的Library Technology Guides网站上,为他所写系列报告所冠标题为“图书馆技术产业报告”(Library Technology Industry Reports),其中还包括2009年以来的繁体中文翻译。
2013年简体中文翻译见:涂虫小记:2013年图书馆自动化市场:创新的浪潮 (05/13/2013)

———-正文的分割线:下一代图书馆服务平台的前世今生———-
2010年报告中首次介绍此类产品,当时并未冠名,只说是“新兴的几种选择,为图书馆自动化创造全新的概念模型”,其时都还不是产品,包括3个项目,即:
Ex Libris的URM
Kuali的Open Library Environment(OLE)
OCLC的WorldCat Management System

2011年报告将此类产品命名为“新一代自动化”(New-generation automation),仍为这3家,2家名称已有改变:
Ex Libris的Alma
OCLC的Web-scale Management Services(简称WMS,已开始销售)
Kuali OLE

2012年报告首次采用“图书馆服务平台”(Library services platforms),对图书馆服务平台“是什么”有略为详细的说明:“突出特色,含印刷與電子圖書館資料管理、取代區域性資料庫之全球知識庫,此基服務導向「軟體即服務」方式透過多租戶與整套APIs提供,使圖書館更互通與可擴展,產品顯著不同以往,有相當不同概念、功能與技術特色,此圖書館服務平台的完成能潛在的替換許多現存產品,含整合自動化系統、電子資源管理工具、OpenURL link resolver與數位資產管理系統。”也即印刷+电子、全球知识库、SaaS、API为其显著特点。包括5家:
OCLC的WorldShare Management Services(改名,简称仍为WMS)
Ex Libris的Alma(第2家开始发售)
Innovative Interface的Sierra Services Platform(新加入,报告发布时仍在测试中【严重怀疑名称来源于此】)
Serial Solutions的Intota(新加入)
Kuali OLE(在报告的“开源”部分提及)

2013年报告中确定名称,有6家:
OCLC的WorldShare Management Service
Ex Libris的Alma
Innovative的Sierra(第3家上市销售)
Intota归入Summon门下(开发中)
Kuali OLE(仍未完成)
VTLS的Open Skies(新加入,开发中)

2014年报告称“近年新兴的图书馆服务平台,为管理电子与印刷馆藏设计,为新的自动化系统品种。遵循面向服务架构,通过多组织SaaS部署,具有区别于ILS的特征……两者在功能上有明显重叠区域,某些产品具有两者特征。”似告诉大家,其实就是一个ILS?
现在有7家了:
OCLC的WMS,Ex Libris的Alma,Innovative的Sierra:都已经有了不少的用户
Intota已在ProQuest名下,仍在开发中,有图书馆联盟有意向在2014年选用
开源的Kuali OLE仍在开发中,但芝加哥大学等2家计划在2014家采用
VTLS称已经完成开发Open Skies [update 2014-6-3: VTLS于2014.5.30被Innovative收购(距愚人节III宣布收购Polaris仅两月),在新闻稿下附“Things You Might Want to Know”有问题提到Open Skies将会如何,但此问题的回答中却未涉及Open Skies,参见:Innovative Acquires VTLS]
新出现1家后来居上,为第4家上市销售者:Civica的Spydus 9,新加坡国家图书馆局已于2013年8月正式使用

在前述LJ的2014“图书馆系统风景线”中,将此类系统称为“下一代图书馆服务平台”,简称“下一代”(The Next Generation)。很容易令人想起当年的下一代(或新一代)目录(现在这个邮件组还在:Next generation catalogs for libraries,NGC4LIB@LISTSERV.ND.EDU)。在2014年报告中也提及下一代目录,称为“发现界面”(discovery interfaces)或“发现工具”(discovery tools),特别指出:(1)曾经在公共图书馆很流行的AquaBrowser(检索词可视化显示),多已被ILS自带联机目录取代,但在荷兰及周边国家仍很受欢迎,现属ProQuest;(2)开源的发现工具仍被不少图书馆采用,尤其是VuFind。
当然,这个和“发现服务”(discovery services)或发现系统(discovery systems)又完全是两回事了。
名称有点混乱而已,尤其是还有两个不同的Primo(Primo和Primo Central)在其中跨界。按下不表。

可参见:UIUC’s Introducing Primo: What’s the difference between Primo & Primo Central?
We’re actually purchasing two products, and you may hear both terms. Primo is the interface through which you search for content. Primo Central is the actual content. So Primo Central is comprised of all of the records for specific articles from various sources (databases, journals, etc.).