国家标准全文公开系统

国家标准化管理委员会日前发布“国家标准全文公开系统”,这是中国政府信息公开的重要进展。依据的是国务院标准化协调推进部际联席会议会议办公室2017年2月3日发布的《推进国家标准公开工作实施方案》
不久前某人去上海市标准化研究院查国际标准,原有的收费复印服务取消了,只能代为购买,已经显示国家在标准服务政策上的变化。

收录内容(摘自网站“特别声明”)
– 本系统将在《国家标准批准发布公告》发布后20个工作日内,公开新批准发布的国家标准文本,其中涉及采标的推荐性国家标准的公开,将在遵守国际版权政策前提下进行。
– 本系统公开了质检总局、国家标准委2017年1月1日前已批准发布的所有强制性国家标准基础类推荐性国家标准(非采标),其他推荐性国家标准(非采标)将在2017年底前陆续完成公开。
食品安全、环境保护、工程建设方面的国家标准未纳入本系统,请访问以下链接进行查询……

公开方式
根据说明,公开方式依国标的强制性/推荐性、以及是否采用国际标准而有所不同,分为三种:
一,全文下载:GB强制性国家标准(非采标)
目前共2,321项
二,在线阅读:GB强制性国家标准(全部)、GB/T推荐性国家标准(非采标)
目前共3470项+3,037项
三,题录信息:GB/T推荐性国家标准 (采标)
目前共3,075项(题录原来就有不少系统提供查询)

很遗憾的是,图情领域相当部分标准都是推荐标准,且多采用国际标准。而只要标注了“采”字,就只提供题录信息,哪怕所采用的并非ISO等要求版权保护的标准。比如文献著录系列标准,采用的是ISBD,曾听说IFLA不申请ISO就是为了促进推广利用。但现在国标注上个“采”字,就名正言顺不公开了(目前GB/T 3792.4-2009“非书资料”是漏网之鱼,未标注“采”字,提供在线阅读)。
结论是,此次公开,图情领域获益有限

via 微信公众号“消防百事通”:“国家标准全文公开系统”上线运行 6507项国标已公开!附网址!(2017-3-17)

PatentsView:专利数据可视化平台

建立于2012年的 PatentsView 专利数据可视化和分析平台,由美国专利商标局联合多家机构开发,是美国政府信息公开的组成部分,目的在于增加美国专利数据的价值、可用性和透明度。虽然只是美国专利,但专利申请者来自世界各国,因此可以概览世界各国、各技术领域的专利情况。
PatentsView 利用专利元数据,从技术分类、受让人/权利所有人、引用模式、位置(国家、美国州)、合作发明者网络等不同途径,呈现百多年来的美国专利。 除了可视化展示,数据还提供API、直接查询和批量下载3种利用方式,以CC-By共享。这是从数字化(专利数据库)到数据化的一个很好例子。

网站提供的4种数据呈现方式
关系
可视化呈现2001年以来,前100项引用最多的专利,其受让人、专利数和发明人之间的关系。可限定地点(美国各州及国家,其中没有中国)和技术领域。
位置
以地图方式呈现2012年以来,各国各城市专利数量。
地图可以放大缩小。中国大陆完全被日本、韩国、台湾压倒,唯一亮点在深圳。上海可怜地在淹没在杭州苏州之下,要把地图放到很大才看得到那个小点。
比较
可视化呈现1976-2016年间,各国、美国各州或技术领域,专利数量变化与对比。
除了专利总量,还可以通过下拉选择,直观了解各国不同年份在不同技术领域的专利数量排名。比如来自中国的专利逐年增加,2016年位总量位列第4,其中化学、仪器也位列第4,而设计位列第3,机械工程和其他位列第6,植物位列第18(仅4件,各国数量都很少)。
查询
包括1976-2016年间专利,可以从专利、发明人、受让人及专利分类查询,以清单方式显示查询结果。可点击结果了解专利详情,并进一步到Google Patents看专利全文。
同时,还可以点击查询结果中的受让人等,获取类似前述“关系”的可视化呈现,如华为技术公司专利关系图;该公司专利最多的发明人(Wei Min Li,361件)的专利及与其他公司专利的关系。

网站提供的3种数据源,可供自主探索
API
提供7个端点,可从专利、发明人、受让人、国家及专利分类等获取数据,用于进一步分析。
网站列出可以探索的3个例子是:
1、【技术】哪些公司拥有3D打印专利?他们位于哪里?在他们得到3D打印专利前后,这些公司在哪些技术中创新?
2、【排名】在最近5年的美国专利中,什么技术最通用?专利排名靠前的美国城市和非美国城市?
3、【发明人】最近30年中,谁是最多产的美国发明人?他们的专利活动(专利数、专利类型和合作发明人)如何随时间变化?
– 查询(见前)
数据下载
数十个不同类型的原始数据文档,从数KB到数十GB不等,可下载后用于数据分析挖掘

比如微信“大数据文摘”上的“苹果VS谷歌,可视化两厂所有专利后看创新模式差异”,就是利用PatentsView制作的。本博文即看此文而撰写。

NISO替代评估计量项目成果(笔记)

NISO于2016年9月发布有关“替代计量”的推荐实践《NISO替代评估计量项目成果》:
Outputs of the NISO Alternative Assessment Metrics Project (NISO RP-25-2016). National Information Standards Organization (NISO), 2016. 77 pages. ISBN 978-1-937522-71-1

Via NISO Press Release: NISO Releases Altmetrics Recommended Practice (2016-9-22)
参见荔园图志:NISO发布替代计量项目成果(2016-11-30)

——— NISO RP-25-2016 笔记 ———
前言
– 关于此推荐实践:NISO替代评估计量项目,始于2013年7月,由Sloan基金资助,解决妨碍广泛采用替代计量的几个方面的局限和差距。
3个工作组
工作组A:研究替代计量文献和其他交流信息,深度讨论不同利益相关人对这些新评价测度的观点和要求【第1节 替代计量】
工作组B:创建文献,意在帮助用户更好地理解数据计量现状,由此提供改进建议,帮助希望有效使用替代计量互相沟通及与外界沟通的机构。【第3节 数据计量,有关研究数据/数据集,替代计量的对象之一】
工作组C:研究与讨论替代计量领域的数据质量问题,这是计量可用于研究和实践之前的基本评估方面。【第5节《替代计量数据质量行动准则》及附录A、B】
【从文中看,还有一个“NISO永久标识符与替代计量成果工作组”,涉及【第2节 替代成果,替代计量的对象】【第4节 永久标识符】)
– 本推荐实践属“NISO商务信息主题委员会”文档,得到该委员会批准。(成员来自EBSCO,研究图书馆中心,NISO,汤森路透,大学及其图书馆等。前述工作组成员也多来自大学及其图书馆与厂商)

1 替代计量定义和使用案例
1.1 目的与范围
1.2 替代计量的定义(1什么是替代计量,2替代计量在研究评价中的学术影响和作用)
1.3 使用案例
– 3个主要使用方面:1展示成就,2研究评估,3发现
8种角色的不同使用案例(每种多个案例):1图书馆员,2研究管理者,3招聘委员会成员,4资助机构成员,5学者/研究者,6出版者/编辑,7媒体官员/公共信息官/记者,8内容平台提供者

2 学术交流中的替代成果【扩大到传统出版物之外的成果】
2.1 背景与环境
2.2 替代学术成果(见学术成果表 NISO Scholarly Outputs table,有墙)
除传统出版物(Publications)外,还包括另外15类“替代成果”【替代计量的对象】:基础科学,能力,代码和软件,传播,数据,教育和培训资料,事件,灰色文献,图像、图表和视频,产业,仪器、设备和发明,方法,规章、合规与法规,标准,其他
2.3 对未来研究的影响

3 数据计量研究与建议【替代成果之一:数据/数据集】
3.1 概要(与CASRAI, DataCite, JISC等有过一系列会谈)
3.2 主要建议
– 研究数据计量应当尽可能广泛可得
– 数据引用应遵循Force 11《数据引用原则联合声明》Joint Declaration of Data Citation Principles),特别是:使用机器可操作的永久标识符,提供引用所需元数据,提供着陆页,数据引用应进入参考文献表或类似元数据)
– 需要开发研究数据使用统计标准。应当基于《COUNTER操作手册》(COUNTER Code of Practice),但也应当考虑研究数据使用的某些特殊方面。对数据下载计量应当是两个公式,既检查“人类”下载,也考虑面向研究的非人类代理
– 研究资助者应当提供机制,支持数据存储库实施互操作和获取计量的标准。
– 数据发现与共享平台应当支持与监控通过API查询对数据的“流”访问。【机器访问】
3.3 背景与环境
3.4 数据计量定义(1发布数据集,2数据引用,3数据使用,4数据的替代计量,5数据的永久标识符)
3.5 参与研究计量的机构
3.6 发现
3.7 建议(1获取研究数据计量,2数据引用,3机器可操作永久标识符,4所需元数据,5着陆而,6参考文献清单,7研究数据使用统计,8数据集替代计量)

4 学术交流中的永久标识符
4.1 背景与环境(最常见DOI,ORCID)
4.2 学术交流文献中的永久标识符(Persistent Identifiers in Scholarly Communication,有墙)
汇总了11个领域的标识符(不到100种,有的似乎并非唯一标识符:如MSC数学主题分类法):计算、通用、政府、生命科学、位置、数学、媒体、个人ID、自然科学、出版、标准
4.3 对未来研究的影响

5 替代计量数据质量行动准则
5.1 目的与范围
5.2 数据质量行动准则术语(替代数据提供者、替代数据集成者、透明度、可重复性、准确性)
5.3 建议
5.3.1 透明度
鼓励替代数据提供者、期望替代数据集成者透明,提供信息有关:
– 数据如何生成、收集和保管(T1)
– 数据如何集成、衍生数据如何生成(T2)
– 数据何时、多久更新(T3)
– 数据如何获取(T4)
– 数据质量如何监控(T5)
5.3.2 可重复性
鼓励替代数据提供者、期望替代数据集成者提供可重复的数据,通过确保:
– 提供的数据随时间推移使用相同方法生成(R1)
– 记录方法及其效果的变化(R2)
– 记录数据后续错误更正的变化(R3)
– 相同时间提供给不同用户的数据一致,如果不一致,记录提供给不同用户群体的访问差异(R4)
– 提供数据是否及如何进行独立验证的信息(R5)
5.3.3 准确性
鼓励替代数据提供者、期望替代数据集成者提供准确的数据,通过确保:
– 数据表达它意在反应的(A1)
– 识别并更正已知错误(A2)
– 传达所提供数据的任何局限(A3)
5.4 年度报告
按照《行动准则》替代数据提供者和替代数据集成者同意提供公开获取年度报告,详细记录遵守如上建议情况。报告应当遵循自我报告表提供的标准格式(见附录A)……

附录A:工作组C“数据质量”行动准则自报告表【第5节中13项建议】
附录B:工作组C“数据质量”行动准则自报告表:样例
8个提供者或集成者样例,由以上13项详细了解各家情况:Altmetric.com;Crossref (CED)-Crossref 事件数据;PLOS (ALM)-科学公共图书馆文章级计量;Facebook;Mendeley;Plum Analytics;Twitter;Wikipedia。
附录C:词汇表
附录D:书目