什么是最佳实践、技术报告、白皮书?

如题,经常看到这些名词,确切含义到底是什么?正好看到NISO在做一个NISO出版物的调查(NISO Portofolio Survey),对他们出版的这几类文献给出了说明。虽然有针对其出版物的一面,但总体解释还是具有通用性的,抄录原文并翻译如下:

– Standards: The most formal, “fixed” documents that NISO publishes, providing rules, guidelines or characteristics for activities or their results. ANSI/NISO standards are approved by the American National Standards Institute and represent the highest form of stakeholder consensus.
标准:NISO发布的最正式、“固定的”文献,对活动或其他成果提供规则、指南或特性。ANSI/NISO标准由美国国家标准学会批准,代表利益相关者共识的最高形式。

– Recommended Practices: “best practices” or “guidelines” for methods, materials, or practices in order to give guidance to the user. These documents usually represent a leading edge, exceptional model, or a proven industry practice.
推荐实践:“最佳实践”或“指南”,就方法、资料或实践,对使用者给予指导。这些文献通常代表前沿、杰出模型或者成熟的行业实践。

– Technical Reports: provide useful information about a particular topic, but do not make specific recommendations about practices to follow. They are thus “descriptive” rather than “prescriptive” in nature.
技术报告:提供有关特定论题的有用信息,但不对遵循的实践做特定推荐。因此在性质上是“描述性的”而非“规定性的”。

– White Papers, Primers, etc.: contributed or solicited papers whose purpose is a call for action, a position paper, or an educational treatise on a specific issue.
白皮书、入门等:投稿或征稿,目的在于对特定问题呼吁行动、表明立场或教育性作品。

《评估元数据标准的原则》发布

《评估元数据标准的原则》,由美国图书馆协会的“图书馆馆藏和技术服务协会”/“图书馆和信息技术协会”下属“元数据标准委员会”( ALCTS/LITA Metadata Standards Committee)制订,经历了10条检查清单草案(2015-3-1)、7条原则草案(2015-10-27),目前的版本是9条原则(2016-8-4)。
Principles for Evaluating Metadata Standards (by Jennifer Liss · August 4, 2016)
原则说明比草案多了一些链接,可视为对所用术语含义的限定或定义,Diane Hillmann对草案评论的其他意见也有一些被吸收。
感觉这个原则要求太高,恐怕没什么元数据标准能够达标。用它自己的话说,“这些原则是期望的,从实用性考量,可能无法完全实施于所有标准”。
参见:如何评价元数据标准?(2015-12-19)
Metadata Matters: Review of: DRAFT Principles for Evaluating Metadata Standards, by Diane Hillmann, December 14, 2015

——— 评估元数据标准的原则(摘译) ———
ALCTS/LITA元数据标准委员会研制了《评估元数据标准的原则》供图、档、博界使用。
原则供了解和支持元数据标准的开发、维护、选择和评估。可应用于元数据结构(字段清单、属性定义等),与内容标准、受控词表和供系统和机器创建元数据的标准一同使用。
委员会希望,这些原则可帮助指导当前元数据标准的细化,以及新元数据结构和词表的创建。这些原则是期望的,从实用性考量,可能无法完全实施于所有标准。
1、元数据标准应当是共享数据网络的一部分【草案无“共享数据”】
元数据标准应当提供机制,表达与其他词表的关系。例如,标准允许使用URI而不仅仅依赖文本串,可由不同来源连接信息,支持分配给索引和研究服务,增加互联网上资源的可见性。
2、元数据标准应当开放、可重用
元数据标准治理和维护团体应当考虑明确的许可证,促进标准和词表的可重用性。【草案说明无“许可证”】
3、元数据标准和创建准则应当有益于用户社区【草案无“创建准则”】
元数据标准创建时,心目中应当有目标受众、相关社区及公众。元数据标准定义的深度和粒度应当优化数据元素,支持由其使用社区定义与贡献的明确使用案例,允许实施者仅使用与其需求相关的功能。
4、元数据标准应当支持创新应用【草案为支持“新研究方法”】
直到21世纪,书目元数据支持相对狭窄的研究脉落,涉及由人阅读、查看、倾听或参与个别资源。随着新的研究方法出现(例如计算语言学、计算书目计量学、语言分析、网络分析),新的数据建模方法面向机器可操作性成熟,元数据标准和交换/访问方法应当方便支持进化建模和使用实践。以机器可操作格式如RelaxNG、XML或RDF编码元数据标准,可帮助推进元数据在新兴领域的计算使用。
5、元数据标准应当有积极维护和治理社区
6、元数据标准应当可扩展、可嵌入、可互操作
成功布署元数据标准的核心,能够有效地与其他标准一起使用。标准应当以模块式设计,允许把其他来源标准的一部分纳入本地系统,每个享有同等优先。相对复杂的标准应当提供“轻”型实施选项,允许更广泛采用和利用,即使这意味着在某些情况下的有损数据传输。“轻”型实施有助于强化具有不同基础智力模型的元数据标准的互操作性。
【Diane Hillmann评论认为:强调“轻实施”作为整个标准的特定部分,给予标准的创建者而非数据创建者太多权力;反而我们应当鼓励使用应用纲要,这样创建实体的特定选择和使用良好存档,其他人可根据所需全部或部分使用数据】
7、元数据标准应当遵循“柔性降级”和“渐进增强”规则【草案为“渐进设计”】
设计元数据标准,应当随着标准的复杂性剥去,元数据柔性降级。去除复杂性,例如让元数据依据稳健标准编码,对非专业观众有用的,或者去除敏感信息,生成的元数据应当仍然有用。由“渐进增强”方法设计的元数据标准,优先简单性,同时足够灵活以支持丰富标准,以适应专门的元数据使用案例。
8、元数据标准应当被文档化 【新增】
应当发布有关元数据标准使用的信息,包括标准应用于现实资源中的实例,其治理与管理结构,设计决策背后的准则,与其他领域元数据标准的连接。……给文档一个许可将澄清其使用与重用。
9、元数据标准应当是包容的,坦承历史与文化倾向 【新增】
元数据标准开发不是中立的,当做出(或不做出)关于一个资源的断言时,在定义可对一个资源作出一个断言时,人类不可避免地赋予价值判断。元数据标准开发者应当了解其价值判断,明确至可能的程度,作为指导原则非中立性、而是世界观的包容性。在元数据标准的创建、实施和进一步强化中,可考虑多元化团队方法。元数据标准和词表应当反映语言的变化。

研究数据管理元数据(附OCLC研究报告《搭积木:为研究数据管理项目奠定基础》)

由于众多研究资助机构要求受助者让数据可公共获取,研究数据管理(RDM,数据监护Data Curation的近义词)在欧美相当受重视,一些图书馆开始主动寻求满足研究者在这方面的需求。OCLC研究部2016年4月13日发布研究报告《搭积木:为研究数据管理项目奠定基础》,为高校启动研究数据管理项目提供指引。从初级的提供信息(第1部分)到实际推出服务(第2部分),报告提供了大量参考资料,包括各机构实施样例与可用资源。

研究数据管理中离不开元数据。“数据只有在可被理解时才是有用的。鼓励研究者提供有关其数据的结构化信息,提供情景与含义,让其他人查找、使用并适当引用数据。至少建议研究者清楚告知他们的故事:如何收集和使用数据、为什么目的。这样的信息最好放在readme.txt文件中,并包含项目信息、项目级元数据,以及有关数据本身的元数据(如文件名、文件格式、所用软件、题名、作者、资助者、版权所有者、描述、关键词、观察单元、数据种类、数据类型和语言)。”(第8页)
对研究者来说,提供元数据可能是个负担,也需要获取帮助——对图书馆来说,就是提供培训;在实施阶段,也包括代研究者做质量控制与清洗。

本报告“元数据”提供的参考资料,包括如何撰写、可用工具、元数据标准清单:
• Cornell University. “Guide to Writing ‘readme’ Style Metadata.” 康奈尔大学(准备元数据文档)
• DMPTool. “Data Management General Guidance: Metadata Data Documentation.” (元数据文档制作工具)
• DCC. “Disciplinary Metadata.”  (英国)数据监护中心:学科元数据一览(生物、地球科学、通用研究数据、物理学、社会与人文科学)
• Research Data Alliance (RDA). “Metadata Directory.” 研究数据联盟:元数据标准目录(艺术与人文科学、工程、生命科学、物理学和数学、社会和行为科学、通用研究数据)

元数据中有“唯一标识符”,包括个人ID、数据集ID及数据集的引用格式,可用于追踪下载、引用及影响测度。数据集有DOI、Handle、ARK(档案资源键),个人有ORCID和ISNI(没提ResearcherID),相关参考资料:
• California Digital Library, University of California Curation Center. “EZID.” 加州数字图书馆、加州大学监护中心:EZID(有偿提供DOI和ARK创建与维护,每年300-2500美元不等)
• International DOI Foundation. “DOI Registration Agencies.”
• ORCID, Inc. “Register for ORCID ID.”  个人ID(开放研究者与贡献者ID)
• ISNI International Agency. “Do you have an ISNI?” 个人ID(国际标准名称标识符)
• DataCite. https://www.datacite.org/

via hangingtogether.org: Metadata for research data management / Karen Smith-Yoshimura (2016-4-18)

——— 搭积木:为研究数据管理项目奠定基础 ———
Erway, Ricky, Laurence Horton, Amy Nurnberger, Reid Otsuji, and Amy Rushing. Building Blocks: Laying the Foundation for a Research Data Management Program. Dublin, Ohio: OCLC Research, 2016.

第1部分:打下基础
需求评估
提供信息(培训,数据管理规划,活动数据管理,元数据,权利与隐私,数据发布、保存与存档)
通告、推广与宣传
第2部分:建立与推出
需求评估(单位、研究者)
定义政策、指南与策略
提供服务(培训,数据管理规划,活动数据管理,元数据,数据发布、保存与存档)
通告、推广与宣传(社区参与与告知,在线呈现,合作发展)

参见荔园图志:OCLC Research发布“建立科研数据管理新基础”的报告 (2016-6-1)