研究合作如何表示?“贡献者角色分类”将成为NISO标准

合作已经成为当今科学研究常态,学术成果合作因此也是常见现象。同时为超越当前的“出版或出局”文化,至关重要的是确保研究人员对他们所做的所有工作给予认可而不仅仅是撰写论文。确保资助、管理数据、编写软件等对完成研究项目至关重要,但是这些角色通常更难确定,因而在评估研究人员的工作时,例如当他们申请晋升或任期或寻求资金时,这些角色往往会被忽略。

2012年惠康信托基金(Wellcome Trust)和哈佛大学共同举办了一个由学术、出版和基金三方面人士参加的研讨会,探索替代性的贡献说明模式。会后由生物医学期刊编辑为主的一个小组开发了一个贡献者角色受控词表(分类法)——即CRediT,含14个贡献者角色【见后】,经过试验项目的测试,其结果于2014年4月发表于Nature Communications

学术出版希望注明合作者的贡献,但非结构化的文本描述,难以管理。CRediT信息可以包含在研究成果(包括文章、书籍/书籍章节、数据集等)的元数据中。目前已有30多家出版机构采用CRediT,并且已将此分类法集成到多个手稿提交系统和其他研究人员平台中。

在CRediT实施中更要求出版者“使CRediT机器可读”——应以JATS xml v1.2 编码带有CRediT标签的贡献。CreDiT Taxonomy Guidelines列出了每种贡献的URL,其命名空间为:https://dictionary.casrai.org/Contributor_Roles/

CRediT这些年一直作为CASRAI的非正式标准进行管理。2019年12月美国国家信息标准化组织(NISO)宣布,已要求将CRediT分类法正式定为ANSI/NISO标准,并成立NISO常设委员会以继续进行教育和宣传工作并促进分类法的持续发展。

2020年4月23日,NISO宣布启动CRediT项目,正式制定和开发“贡献者角色分类法”(CRediT)作为ANSI/NISO标准。工作重点包括反映更广范围的研究贡献,以支持超出其最初STM(科学、技术和数学)的学科和主题领域

via NISO

NISO Launches Work on Contributor Role Taxonomy (CRediT) Initiative(2020-4-23)

Next Steps Toward Using CRediT for Credit(2019-12)

关于CRediT的更多信息见CASRAI页面:CRediT – Contributor Roles Taxonomy

  • 定义)CRediT(贡献者角色分类法)是一种高级分类法,包括14个角色,可以用来代表贡献者通常在科学学术成果中所扮演的角色。 这些角色描述了每个贡献者对学术成果的具体贡献。
  • (其他栏目)14个贡献者角色、贡献者角色定义、背景、益处、采用者、如何实施、相关链接、责任主席

—— CRediT:14个贡献者角色——

  • 1. Conceptualization 概念化:总体研究目标的制定或演化
  • 2. Data curation 数据管理:用于注释、清理数据和维护研究数据以供初次使用和以后重用的管理活动
  • 3. Formal analysis 形式分析:运用统计、数学、计算或其他形式技术来分析或综合研究数据
  • 4. Funding acquisition 资金获取:为导致出版的项目获得财务支持
  • 5. Investigation 调查:进行研究和调查过程,特别是进行实验或收集数据/证据
  • 6. Methodology 方法论:方法论的开发或设计;建立模型
  • 7. Project administration 项目管理:研究活动、计划和执行的管理和协调责任
  • 8. Resources 资源:提供研究材料、试剂、材料、患者、实验室样品、动物、仪器、计算资源或其他分析工具
  • 9. Software 软件:编程、软件开发;设计计算机程序;实施计算机代码和支持算法;测试现有代码组件
  • 10. Supervision 监督:对研究活动的计划和执行进行监督和领导责任,包括核心团队外部的指导
  • 11. Validation 验证:对结果/实验和其他研究成果的整体复制/可再现性进行验证,无论是作为活动的一部分还是独立的
  • 12. Visualization 可视化:准备、创建和/或演示已发表的作品,特别是可视化/数据演示
  • 13. Writing – original draft 撰写–初始草稿:准备、创作和/或介绍已发表的作品,特别是撰写初始草稿(包括实质性翻译)
  • 14. Writing – review and editing 写作–评审和编辑:初始研究小组的人员对已发表作品的准备、创作和/或展示,特别是批判性评审、评论或修订,包括出版前或出版后的阶段

信息技术:元数据及其注册国际标准

ISO/IEC JTC1(国际标准化组织与国际电工委员会联合技术委员会)是信息技术国际标准的制订机构,也是制订ISO标准最多的技术委员会。旗下数据管理和交换部(Data management and interchange)有元数据工作组(ISO/IEC JTC1 SC32 WG2),负责制订元数据及其注册的国际标准。2019年发布的标准有3项:

  • ISO/IEC 11179-2:2019 Information technology — Metadata registries (MDR) — Part 2: Classification【第3版】
  • ISO/IEC 11179-7:2019 Information technology — Metadata registries (MDR) — Part 7: Metamodel for data set registration【第1版】
  • ISO/IEC 19583-1:2019 Information technology — Concepts and usage of metadata — Part 1: Metadata concepts【第1版】
  • ISO/IEC 19583-2(Part 2: Metadata usage)同样在2015年提出,目前仍停留在初始状态(10.99)

元数据工作组有网站http://metadata-standards.org/,主页左侧导航栏有开发维护标准清单(标题与标准不尽相同),各标准页面汇聚从开发到发布各阶段的文档,包括标准最终文本——只要接受 ISO Customer Licence Agreement,即可下载正式发布标准。不过2014年后该网站仅更新项目状态,新内容移到ISO技术委员会(ISOTC)的统一网站,文档大多只能在ISO网站付费下载。ISOTC网站除了有技术委员会结构图,详细列出下属二级的部门(SC)和工作组(WG),对普通用户来说几乎没有其他可用内容。ISO官网有部门(SC)页面(如数据管理和交换部),包罗工作组开发的ISO标准,但没有标出相应的工作组。要了解元数据工作组的工作,还是需要到其原网站。以下为其名下ISO标准一览(*有多部分):

11179-* Metadata registry (MDR)
· Part 1: Framework【1999第1版,2004第2版,2015第3版】
· Part 2: Classification【2000第1版,2005第2版,2019第3版】
· Part 3: Registry metamodel and basic attributes【1994第1版,2003第2版,2013第3版】
· Part 4: Formulation of data definitions【1995第1版,2004第2版/通过2015评审】
· Part 5: Naming and identification principles【1995第1版,2005第2版,2015第3版】
· Part 6: Registration【1997第1版,2005第2版,2015第3版】
· Part 7: Metamodel for data set registration【2019第1版】
14957  Representation of data element values — Notation of the format【1996第1版,2010第2版/通过2016评审】
19583-* Concepts and usage of metadata
· Part 1: Metadata concepts【2019第1版】
· Part 2: Metadata usage【2020开发中】
19763-* Metamodel Framework for Interoperability (MFI)
· Part 1: Reference model【2007第1版,2015第2版】
· Part 3: Metamodel for ontology registration【2007第1版,2010第2版】
· Part 5: Metamodel for process model registration【2015第1版】
· Part 6: Registry Summary【2015第1版】
· Part 7: Metamodel for service registration【2015第1版】
· Part 8: Metamodel for role and goal registration【2015第1版】
· Part 9: (Technical Report) On Demand Model Selection (ODMS) 【2015第1版】
· Part 10: Core model and basic mapping【2014第1版】
· Part 12: Metamodel for information model registration【2015第1版】
· Part 13: Metamodel for forms registration【2016第1版】
19773  Metadata registries (MDR) Modules【2011第1版/通过2019评审】
20943-* Procedures for Achieving Metadata Registry Content Consistency
· Part 1: Data Elements【2003第1版】
· Part 2: XML Structured Data【搁置】
· Part 3: Value Domains【2004第1版】
· Part 4: Overview【搁置】
· Part 5: Metadata Mapping Procedure【2013第1版】
· Part 6: Framework for generating ontologies【2013第1版】
20944-* Metadata Registry Interoperability & Binding (MDR-IB)
· Part 1: Framework, common vocabulary, and common provisions for conformance【2013第1版】
· Part 2: Coding Bindings【2013第1版】
· Part 3: API Bindings【2013第1版】
· Part 4: Protocol Bindings【2013第1版】
· Part 5: Profiles Bindings【2013第1版】
24706  Metadata for technical standards and specifications documents【项目无进展而取消】
· Part 1: Document description elements
· Part 2: URI naming and resolution techniques
24707  Common logic (CL) — A framework for a family of logic-based languages【2007第1版,2018第2版】 

ISO 15836:都柏林核心元数据元素集

都柏林核心元数据元素集作为ISO标准,第一部分出版于2017年,第二部分2019年12月出版。DCMI官网尚未更新信息,列出的最近更新标准有三:

ISO网站上标准是要付费的。但看介绍,内容来自官网2012年的DCMI Metadata Terms

  • 命名空间/elements/1.1/ ,包含15个核心元素(第2节),在ISO 15836-1:2017
  • 命名空间/terms/,包含属性(第3节)和类(第6节),在ISO 15836-2:2019
  • 后者也包含15个核心元素,但/terms/命名空间中的元素规定了定义域和值域,因而语义较窄。
  • ISO 15836不包括DCMI Metadata Terms的第4节词表编码体系(Vocabulary Encoding Schemes,VES)、第5节语法编码体系(Syntax Encoding Schemes,SES)、第7节类型词表(DCMI Type Vocabulary)和第8节与DCMI抽象模型相关的术语。
  • ISO 15836中的元素、属性和类都有URI,可用于关联数据

DC的属性包括核心元素和以前归在扩展或限定的元素。近年看到采用DC属性的研究/应用,也许是因为属性基本上没有规定定义域,所以少见采用相应类。以下将“类”粗略分组列出(缩进为下位类或实例,括号内为对应属性,标*者无对应属性):

BibliographicResource*,PhysicalResource*

AgentClass(audience,educationLevel,mediator值域)

  • Agent(实例)(contributor,creator,publisher,rightsHolder值域)

LocationPeriodOrJurisdiction(coverage值域)

  • Jurisdiction*
  • Location(spatial值域)
  • PeriodOfTime(temporal值域)

MediaTypeOrExtent(format值域)

  • MediaType
    • FileFormat*
    • PhysicalMedium(medium值域)
  • SizeOrDuration(extent值域)

Frequency(accrualPeriodicity值域),MethodOfAccrual(accrualMethod值域),Policy(accrualPolicy值域)

LicenseDocument(licence值域),RightsStatement(rights,accessRights值域),ProvenanceStatement(provenance值域)

LinguisticSystem(language值域),MethodOfInstruction(instructionalMethod值域),Standard(conformsTo值域)