NISO替代评估计量项目成果(笔记)

NISO于2016年9月发布有关“替代计量”的推荐实践《NISO替代评估计量项目成果》:
Outputs of the NISO Alternative Assessment Metrics Project (NISO RP-25-2016). National Information Standards Organization (NISO), 2016. 77 pages. ISBN 978-1-937522-71-1

Via NISO Press Release: NISO Releases Altmetrics Recommended Practice (2016-9-22)
参见荔园图志:NISO发布替代计量项目成果(2016-11-30)

——— NISO RP-25-2016 笔记 ———
前言
– 关于此推荐实践:NISO替代评估计量项目,始于2013年7月,由Sloan基金资助,解决妨碍广泛采用替代计量的几个方面的局限和差距。
3个工作组
工作组A:研究替代计量文献和其他交流信息,深度讨论不同利益相关人对这些新评价测度的观点和要求【第1节 替代计量】
工作组B:创建文献,意在帮助用户更好地理解数据计量现状,由此提供改进建议,帮助希望有效使用替代计量互相沟通及与外界沟通的机构。【第3节 数据计量,有关研究数据/数据集,替代计量的对象之一】
工作组C:研究与讨论替代计量领域的数据质量问题,这是计量可用于研究和实践之前的基本评估方面。【第5节《替代计量数据质量行动准则》及附录A、B】
【从文中看,还有一个“NISO永久标识符与替代计量成果工作组”,涉及【第2节 替代成果,替代计量的对象】【第4节 永久标识符】)
– 本推荐实践属“NISO商务信息主题委员会”文档,得到该委员会批准。(成员来自EBSCO,研究图书馆中心,NISO,汤森路透,大学及其图书馆等。前述工作组成员也多来自大学及其图书馆与厂商)

1 替代计量定义和使用案例
1.1 目的与范围
1.2 替代计量的定义(1什么是替代计量,2替代计量在研究评价中的学术影响和作用)
1.3 使用案例
– 3个主要使用方面:1展示成就,2研究评估,3发现
8种角色的不同使用案例(每种多个案例):1图书馆员,2研究管理者,3招聘委员会成员,4资助机构成员,5学者/研究者,6出版者/编辑,7媒体官员/公共信息官/记者,8内容平台提供者

2 学术交流中的替代成果【扩大到传统出版物之外的成果】
2.1 背景与环境
2.2 替代学术成果(见学术成果表 NISO Scholarly Outputs table,有墙)
除传统出版物(Publications)外,还包括另外15类“替代成果”【替代计量的对象】:基础科学,能力,代码和软件,传播,数据,教育和培训资料,事件,灰色文献,图像、图表和视频,产业,仪器、设备和发明,方法,规章、合规与法规,标准,其他
2.3 对未来研究的影响

3 数据计量研究与建议【替代成果之一:数据/数据集】
3.1 概要(与CASRAI, DataCite, JISC等有过一系列会谈)
3.2 主要建议
– 研究数据计量应当尽可能广泛可得
– 数据引用应遵循Force 11《数据引用原则联合声明》Joint Declaration of Data Citation Principles),特别是:使用机器可操作的永久标识符,提供引用所需元数据,提供着陆页,数据引用应进入参考文献表或类似元数据)
– 需要开发研究数据使用统计标准。应当基于《COUNTER操作手册》(COUNTER Code of Practice),但也应当考虑研究数据使用的某些特殊方面。对数据下载计量应当是两个公式,既检查“人类”下载,也考虑面向研究的非人类代理
– 研究资助者应当提供机制,支持数据存储库实施互操作和获取计量的标准。
– 数据发现与共享平台应当支持与监控通过API查询对数据的“流”访问。【机器访问】
3.3 背景与环境
3.4 数据计量定义(1发布数据集,2数据引用,3数据使用,4数据的替代计量,5数据的永久标识符)
3.5 参与研究计量的机构
3.6 发现
3.7 建议(1获取研究数据计量,2数据引用,3机器可操作永久标识符,4所需元数据,5着陆而,6参考文献清单,7研究数据使用统计,8数据集替代计量)

4 学术交流中的永久标识符
4.1 背景与环境(最常见DOI,ORCID)
4.2 学术交流文献中的永久标识符(Persistent Identifiers in Scholarly Communication,有墙)
汇总了11个领域的标识符(不到100种,有的似乎并非唯一标识符:如MSC数学主题分类法):计算、通用、政府、生命科学、位置、数学、媒体、个人ID、自然科学、出版、标准
4.3 对未来研究的影响

5 替代计量数据质量行动准则
5.1 目的与范围
5.2 数据质量行动准则术语(替代数据提供者、替代数据集成者、透明度、可重复性、准确性)
5.3 建议
5.3.1 透明度
鼓励替代数据提供者、期望替代数据集成者透明,提供信息有关:
– 数据如何生成、收集和保管(T1)
– 数据如何集成、衍生数据如何生成(T2)
– 数据何时、多久更新(T3)
– 数据如何获取(T4)
– 数据质量如何监控(T5)
5.3.2 可重复性
鼓励替代数据提供者、期望替代数据集成者提供可重复的数据,通过确保:
– 提供的数据随时间推移使用相同方法生成(R1)
– 记录方法及其效果的变化(R2)
– 记录数据后续错误更正的变化(R3)
– 相同时间提供给不同用户的数据一致,如果不一致,记录提供给不同用户群体的访问差异(R4)
– 提供数据是否及如何进行独立验证的信息(R5)
5.3.3 准确性
鼓励替代数据提供者、期望替代数据集成者提供准确的数据,通过确保:
– 数据表达它意在反应的(A1)
– 识别并更正已知错误(A2)
– 传达所提供数据的任何局限(A3)
5.4 年度报告
按照《行动准则》替代数据提供者和替代数据集成者同意提供公开获取年度报告,详细记录遵守如上建议情况。报告应当遵循自我报告表提供的标准格式(见附录A)……

附录A:工作组C“数据质量”行动准则自报告表【第5节中13项建议】
附录B:工作组C“数据质量”行动准则自报告表:样例
8个提供者或集成者样例,由以上13项详细了解各家情况:Altmetric.com;Crossref (CED)-Crossref 事件数据;PLOS (ALM)-科学公共图书馆文章级计量;Facebook;Mendeley;Plum Analytics;Twitter;Wikipedia。
附录C:词汇表
附录D:书目

NISO推荐实践《期刊迁移实践条例》Transfer Code of Practice

国际上,期刊更换出版者或发布平台是常见现象,这被称为“迁移”(Transfer 转让)。据称2016年1-10月,EBSCO共录得超过5000种期刊更换出版者。在增强迁移通告服务(ETAS)(介绍见下)侧栏“迁移通知”下,有最新变更出版者的期刊,可以由生效日期实际感受下数量之多。
期刊迁移对图书馆、中介机构(如连续出版物订购代理、链接解析器管理者、大型发现系统供应商)和读者有负面影响。常常期刊仍在出版,但像是消失了,现有信息系统到期刊内容的链接中断,影响对期刊的订阅与访问。(NISO RP-24-2015,p.v)
为应对这个问题,英国连续出版物集团(UKSG)自2006年开始期刊迁移项目,于2008年发布第1版《期刊迁移实践条例》(Transfer Code of Practice),指导期刊的迁出和接收出版者如何确保以最小的中断,让所有利益相关人能继续获取内容。
2014年,项目转由NISO主持(Transfer),维护机构更换消息于2015年宣布(UKSG Transfer Code of Practice to be Maintained by NISO (2015-2-9)) ,随后《期刊迁移实践条例》 作为NISO“推荐实践”发布第3版(NISO RP-24-2015)。

《期刊迁移实践条例》由图书馆、出版者出版者和其他专家组成的“迁移指导委员会”管理,主要活动分为三个方面(以下编辑译自NISO的 Transfer 网页):
1、期刊迁移实践条例。当前为第3版:Transfer Code of Practice, Version 3.0. NISO RP-24-2015. National Information Standards Organization (NISO), 2015. 11 pages. ISBN 978-1-937522-40-7
已签署此条例的出版社见“Transfer Publishers”页面,包括很多大出版商。
2、增强迁移通告服务Enhanced Transfer Alerting Service, ETAS)。方便期刊迁移沟通,本服务由以下3部分组成:【在JISC网站】
期刊迁移通知数据库Journal Transfer Notification Database):可用题名、关键词、ISSN查询期刊迁移详细信息 。
迁移通告邮件组Transfer Notification List):每当使用ETAS宣布期刊迁移,注册者会收到电子邮件通告。
迁移通知博客Transfer Notification Blog,有墙)。存储来自出版社的期刊迁移信息,作为迁移信息存档。
3、迁移的教育和支持活动。迁移指导委员会致力于向出版者、图书馆员和出版过程中的其他利益相关者提供实践支持。

自《条例》作为“推荐实践”发布以来,NISO每年都召开公开远程会议加以推广。2017年会议将于2月13日举行。

NISO发布入门读物《理解元数据》

NISO上月发布初入门读物《理解元数据》。2004年时NISO曾发布过类似出版物,此为十多年后的更新版。作者Jenn Riley是加拿大麦吉尔大学图书馆数字倡议部副主任(Associate Dean, Digital Initiatives),特别说明此次增加了关联数据相关内容。
本指南重点在文化遗产领域的元数据,读者对象是已经用元数据工作的有经验的信息管理者,以及不太熟悉信息交换问题的专业人员。对于元数据的作用,NISO执行理事Todd Carpenter称: “在数字世界,有关内容的信息常会比内容本身更重要。没有好的元数据,信息有效性就消失了。”

UNDERSTANDING METADATA: WHAT IS METADATA, AND WHAT IS IT FOR? / Jenn Riley. National Information Standards Organization (NISO), 2017. 45 pages. ISBN 978-1-937522-72-8

本入门中,各种常见元数据的介绍占很大篇幅,一般都会介绍其标记方式(XML、RDF等),但并没有统一形式,看起来比较轻松。
非常有意思的是,在开始的“日常生活中的元数据”部分,特别提出亚马逊的元数据行动(p.3, Metadata in Action: Amazon and its Affiliates),又在结束的“元数据如何生成”部分提到亚马逊通过ONIX供应链共享元数据(p.38),但始终没有介绍Amazon采用的元数据格式。
“未来方向”部分,对“众包”的评价相当高,也确实反映现实:
元数据的开放与互联的新兴文化,导致对“权威”或“好的”元数据的重新定义……几乎每个论题线上都有见多识广的爱好者社区,相比承担内容管理职责、但缺少这一主题专家的机构,这些个人常能提供好得多的元数据。智能系统可结合更传统来源的元数据与用户生成元数据……。(p.40)

这是NISO“入门出版物”系列第2本,2015年已发布《研究数据管理》。参见:NISO发布初级读物《研究数据管理》(2015-9-7)

Via NISO Press Release: NISO Publishes “Understanding Metadata” Primer (2017-1-18)

——— 《理解元数据》目次(及笔记概要) ———

导言
日常生活中的元数据 (2012谷歌“知识图谱”:35亿“事实”,约5亿元数据-人、地、事及关系;2010 LC存档推特内容及元数据)
文化遗产世界中的元数据 (图档博)
元数据类型 (1描述元数据;2管理元数据:技术/保存/权利;3结构元数据;4标记语言)
元数据如何存储与分享?
– 关系数据库
– XML (2000s)
– 关联数据和RDF (2006)
标准化元数据
– 受控词表 (提及:Internet MIME types, Spotify genres, BISAC, LCSH)
– 内容标准 (提及:Wikipedia Manual of Style guidelines for Infoboxes, DACS, RAD, AACR2, RDA)
著名元数据语言:广泛使用的例子
– Schema.org (2011发布,近600“类型”、超800属性。2014.4 OCLC用来发布近2亿图书等的书目描述)
– OWL:Web本体语言
– SKOS:简单知识组织系统
– DC:都柏林核心 (DC、DCTerms。有对《DCMI抽象模型》和《新加坡框架》的简评)
– FOAF:朋友的朋友
– ONIX:联机信息交换 (1图书,2连续出版物,3出版物许可证。2009年3.0支持电子书)
– Exif:可交换图像文件格式 (Tiff和JPEG支持嵌入Exif,但JPEG2000,PNG,GIF不支持)
著名元数据语言:文化遗产界的例子
– MARC:机读目录 (1968)
– BIBFRAME:书目框架项目 (2016.4发布2.0)
– MODS:元数据对象描述方案 (20个顶层元素)
– CIDOC CRM:CIDOC概念参考模型 (博物馆界,基础本体。区别性特征:不仅专注描述文化遗产对象,而且专注与其创建与生命周相关的行动与事件)
– CDWA:艺术作品描述类别 (艺术博物馆界,540个数据元素及其关系)
– VRA Core:视觉资源协会核心 (艺术史、艺术与建筑,有约束版、非约束版。区别性特征:有关艺术作品本身的元数据与有关这些作品图像的元数据分离)
– EAD:编码档案描述
– 著名元数据语言:其他例子
— DDI:数据文档项目(大元素集,描述社会、行为和经济科学中的数据……随着研究界越来越重视数据管理规划,以及研究数据的开放传播和长期管理,DDI越来越重要)
— PREMIS:保存元数据实施策略 (数字归档领域。定义5个实体:对象,环境,事件,行为主体,权利)
— TEI:文本编码项目 (机读文本标记语言。文本元素:1基本结构特性;2语义元素;3超或非文本特性:表格,嵌入图形)
— MEI:音乐编码项目 (乐谱,基于TEI)
元数据如何生成? (1人力、专家;2自动处理;3分享;4自动生成:自动转录讲话,脸部识别,潜在语义分析和论题建模,时态和名称-实体识别,自动图像标注,音乐信息检索)
未来方向 (1关联数据;2自动创建和维护元数据;3元数据开放与互联:众包、用户生成元数据)
附录A:资源
– 元数据标准和词表
– XML标准和资源
– RDF标准和资源
– RDF序列化
– 关联数据资源
– 观察项目(BIBFRAME,DBPedia,DPLA)