SUSHI协议成为NISO正式标准Z39.93-2013

SUSHI全称Standardized Usage Statistics Harvesting Initiative,是为收割COUNTER格式的电子资源使用统计数据而制订的标准。SUSHI曾作为标准草案发布,于2006.9.20-2007.5.20间试用征求意见,[成为正式标准Z39.93-2007]。事隔五年,SUSHI在经重新审阅、做了两处小修改后,日前[2013.2.26]作为正式标准[第2版ANSI/NISO ]Z39.93-2013发布。

尽管当初是针对COUNT报告而开发的,但SUSHI是一个通用协议,也适用于定制的非COUNTER使用报告

NISO的SUSHI网站:http://www.niso.org/workrooms/sushi
有标准文本下载,[有开源的收割工具介绍……]

[update 2013-3-8]
via NISO news: NISO Publishes Maintenance Revisions of Dublin Core and SUSHI Standards (05 Mar 2013)
同时,DC元数据基本集也小做修改,更新为Z39.85-2012:Dublin Core Metadata Element Set (ANSI/NISO Z39.85-2012)
癔测:所谓“维护修订”,大概就是标准每隔比如5年要修订一次,以说明此标准仍在维护中,并未废弃吧。

———-附:COUNTER———-
COUNTER(Counting Online Usage of Networked Electronic Resources)网站:http://www.projectcounter.org/(有目前使用标准的文本下载)
COUNTER始于2002.3,2003年首次发布COUNTER Code of Practice,针对联机期刊和数据库。
最新为Release 4:COUNTER Code of Practice for e-Resources (2012.4出版),包含各类电子资源(期刊、数据库、图书和参考作品、多媒体等),取代COUNTER Code of Practice for Journals and Databases(Release 3,2008.8出版)和COUNTER Code of Practice for Books and Reference Works(Release 1,2006.3出版)。最迟实施日为2013.12.31,之后如不符合Release 4标准的,将不视为与COUNTER兼容。
为配合SUSHI收割利用,[和Release 3一样,]Release 4在原电子表格格式的基础上,要求COUNTER报告必须提供XML格式(详见Release 4, 3. SUSHI)。

学术图书馆和研究数据服务:当前实践及未来计划

学术图书馆和研究数据服务:当前实践及未来计划──学院与研究图书馆协会白皮书

Academic Libraries and Research Data Services: Current Practices and Plans for the Future : An ACRL White Paper / by Carol Tenopir, Ben Birch, Suzie Allard. Association of College & Research Libraries, June 2012 (54p. pdf)
三位作者来自田纳西大学信息科学学院信息与交流研究中心。
对大学成员馆的调查结果分析,截止时间2012.1.25,基本反映20111年底的状况。有大量的统计数表,附调查表。
全部351所图书馆、回收221所(回收率63%),包括大专、本科、博士三个层次的大学(p.14)。
研究数据服务、数据管理、数据保管(Data Curation),差不多可视为同义语吧。
读概要后的感觉是:
1、资助机构的要求,应该是研究数据服务能否发展的关键促进因素。(目前来说,我国还没有这个促进因素,但应该也不会太遥远了)
2、图书馆应具有危机意识。研究型图书馆的生存和发展,取决于其是否是所在机构的知识创造过程中的一环。以往图书馆的主要责任是提供信息获取,现在及未来则将增加数据管理。(在国内,大学中的档案馆、网络中心等机构可能在这方面成为图书馆的竞争者。)
3、图书馆员有能力做数据管理吗?p.12图2列出了数据生命周期(data life cycle)各个阶段,图书馆员考虑的问题。
Figure 2
The librarian ponders whether she has the background, skills, and education to provide RDS.
via ACRL insider: Academic Libraries and Research Data Services (November 26th, 2012)
———Executive summary(译文)———-
随着科学变得越来越协作性、强化数据和计算性,学术研究人员正面临一系列数据管理需求。这些需求与资助方要求数据管理计划两相结合,对大学的研究数据服务而言,是既有需求又势在必行。对校园中的研究数据服务活动,学术图书馆可能是一个理想的中心,为学术图书馆成为本机构知识创造周期中更积极的参与者,提供了一个独特的机会。最近学术图书馆界已把数据保管(data curation)作为2012年的十大趋势之一。一些学术图书馆已经参与这些活动,其他馆正考察可以提供一系列研究数据服务的途径。
本研究调查美国和加拿大的学院和研究图书馆协会(ACRL)的学术图书馆成员,对两国学术图书馆研究数据服务的现状与未来计划提供一个基准评估。
主要发现与观察:
– 目前只有小部分学术图书馆提供研究数据服务(RDS),但1/4到1/3的学术图书馆计划在未来两年内提供一些服务
– 最常提供或计划的RDS是创建Web指南、帮助定位数据。这是传统图书馆实践在新环境中的延伸。
– 较大的或授予博士学位机构中的图书馆,更易于提供一系列信息/咨询类服务,尽管各种规模机构中都有一些学术图书馆计划未来提供某些RDS。其中一些服务,扩大了图书馆在知识创造过程中的作用。
– 较大的或授予博士学位机构中的图书馆,更易于提供或计划提供技术的/亲手实践的RDS。但是,大专或本科机构的图书馆应当考虑提供一些这类服务,因为图书馆有必要帮助机构满足其任务目标,如促进学生进入四年制大学和研究生学习。[这也是RDS?]
– 接受国家科学基金(NSF)资助学校的图书馆更易于提供或计划提供各种类型的RDS。这说明,资助机构要求正推动RDS需求。随着预算决策趋向承担更大责任,更多机构会说明数据管理责任,因此学校的RDA需求会增长。如果图书馆不积极参与提供这些服务,其他单位会被逼介入服务,从而会削弱图书馆作为研究过程重要伙伴的形象。
– 极少学校图书馆负责发展研究数据政策。能够作为思想交换库(clearinghouse of ideas)、为建立这些政策提供专家知识,是图书馆成为知识创建过程成员的一个机会。
– 在RDS方面常与学校其他单位协作,通常是研究办公室。对图书馆在知识创造过程中发挥重要作用、帮助支持图书馆对校园的价值,这种协作是一个极好的方式。[研究办公室相当于我们的科研处、社科处吧]
– 提供RDS最通常的战略是重新安排现有图书馆员工工作。这也需要得到员工专业发展的支持,这样他们可以获得所需的专业知识,以提供完整的RDS。
– 提供RDS的图书馆大多数已经或计划重新安排现有员工工作以承担这些责任。这可能是财政要求,可以此为由获得附加预算设置主要与RDS有关的新职位。本研究针对科学,而其他学科也开始越来越协作性、强化数据和计算化,因此RDS服务会跨越学科边界,服务更范围的研究者。
– 图书馆依赖会议或培训班向其员工提供RDS培训。图书馆需要一些机构支持,送其馆员参加专业发展,专业组织继续提供这类培训很重要。对领先的图书馆而言,有机会与同行或其他相关图书馆创建导师关系,帮助向更多馆员传播专业知识。
———-正文提及的两个工具网站———-
DataOne: Resource(数据管理工具)

WorldCat关联数据子集批量下载(附OCLC的其他关联数据)

在刚结束的IFLA年会上,Richard Wallis宣布提供WorldCat关联数据的批量下载──自然不会是全部,而是一个子集,给大家玩玩,可在本地安装后用SPARQL做试验:
书目记录数:120万(对照:WorldCat全部记录2.5亿)
入选条件:超过250个图书馆收藏
文件大小:1GB
三元组数:8千万
格式:RDF n-triples
数据集描述:WorldCat VoID Dataset Description(含dataDump下载网址)

via 书社会远洋过客转贴 2012-8-18
原博文:Data Liberate: Get Yourself a Linked Data Piece of WorldCat to Play With / By Richard Wallis on August 12, 2012
OCLC官网消息: OCLC provides downloadable linked data file for the 1 million most widely held works in WorldCat, 14 August 2012

——–关于OCLC及其关联数据的八卦———-
OCLC一直很注重对自己权利的保护,事例如:
– 2003年图书馆酒店商标案
参见:OCLC与图书馆酒店的故事:版权与商标(2006年9月25日)

OCLC与图书馆酒店的故事:版权与商标


– 2009年闹得沸沸扬扬的WorldCat记录使用政策
参见:编目与元数据2009(2010年1月3日)
/posts/2010/0103/86
圖書館觀點:關於「WorldCat書目記錄使用及轉出政策」(1st Apr 2009),有墙
后续影响有:瑞典国家图书馆终止加入WorldCat谈判(2011年12月22日)
/posts/2011/1222/1990

OCLC大规模加入此轮关联数据潮流,不过对权利的保护一如既往:
– VIAF提供批量下载,但那只是OCLC的一项服务,内容并不属于OCLC
参见:虚拟国际规范档移交OCLC(2012年4月5日)
/posts/2012/0405/2112
– FAST提供批量下载,是LCSH部分内容的分面版,内容也不属于OCLC
参见:FAST: 主题词分面应用(2007年11月28日)
/posts/2007/1128/392
– DDC23版全部23,000多个分类号和类名在dewey.info上发布为关联数据。得知后在网站上找了半天,也没有发现完整的DDC(只有原来的千分表)。后来远洋师告知,只是assignable,并不免费公开DDC──那还是要卖银子的。
– 与DDC几乎同时发布的还有WorldCat所有书目记录,显示在每条记录的详细页面下
参见:WorldCat也关联数据了(2012年6月21日)
/posts/2012/0621/2221
– 下载:WorldCat子集
– 关联数据发布中采用开放数据许可ODC-BY而非公共域许可CC0
参见:虚拟国际规范档数据集以ODC-By许可提供(2012年5月5日)
/posts/2012/0505/2164
官网消息:OCLC recommends Open Data Commons Attribution License (ODC-BY) for WorldCat data (6 August 2012)
CC网站对ODC-BY和CC0的分析:Library catalog metadata: Open licensing or public domain? / Timothy Vollmer (August 14th, 2012) ,感谢Nalsi提供信息
ODC-BY: Open Data Commons – Attribution License
[update] 指南:OCLC linked data attribution guidelines