SUSHI协议成为NISO正式标准Z39.93-2013

SUSHI全称Standardized Usage Statistics Harvesting Initiative,是为收割COUNTER格式的电子资源使用统计数据而制订的标准。SUSHI曾作为标准草案发布,于2006.9.20-2007.5.20间试用征求意见,[成为正式标准Z39.93-2007]。事隔五年,SUSHI在经重新审阅、做了两处小修改后,日前[2013.2.26]作为正式标准[第2版ANSI/NISO ]Z39.93-2013发布。

尽管当初是针对COUNT报告而开发的,但SUSHI是一个通用协议,也适用于定制的非COUNTER使用报告

NISO的SUSHI网站:http://www.niso.org/workrooms/sushi
有标准文本下载,[有开源的收割工具介绍……]

[update 2013-3-8]
via NISO news: NISO Publishes Maintenance Revisions of Dublin Core and SUSHI Standards (05 Mar 2013)
同时,DC元数据基本集也小做修改,更新为Z39.85-2012:Dublin Core Metadata Element Set (ANSI/NISO Z39.85-2012)
癔测:所谓“维护修订”,大概就是标准每隔比如5年要修订一次,以说明此标准仍在维护中,并未废弃吧。

———-附:COUNTER———-
COUNTER(Counting Online Usage of Networked Electronic Resources)网站:http://www.projectcounter.org/(有目前使用标准的文本下载)
COUNTER始于2002.3,2003年首次发布COUNTER Code of Practice,针对联机期刊和数据库。
最新为Release 4:COUNTER Code of Practice for e-Resources (2012.4出版),包含各类电子资源(期刊、数据库、图书和参考作品、多媒体等),取代COUNTER Code of Practice for Journals and Databases(Release 3,2008.8出版)和COUNTER Code of Practice for Books and Reference Works(Release 1,2006.3出版)。最迟实施日为2013.12.31,之后如不符合Release 4标准的,将不视为与COUNTER兼容。
为配合SUSHI收割利用,[和Release 3一样,]Release 4在原电子表格格式的基础上,要求COUNTER报告必须提供XML格式(详见Release 4, 3. SUSHI)。

今天的网络生活

    今天,就在刚才,把Blog首页上放了二个多月的Lib2.07的链接和Logo拿掉了,会议都结束那么久了。尽管自己没有去厦门,也算帮着宣传了一把,而且基本上可算是全程网上参与

    今天,征得图有其表同意,OA了《数字图书馆论坛》第四期“发展中的新一代OPAC”,此文是应约配合Lib2.07而写的。如蒙引用,敬请注明出处。

    昨天看到Keven写“读我所读”,今天把自己的Googlepage又折腾了一番。“网络生存”部分,就是我的简化版“读我所读”了。

    长假七天,应该是天天上网的,因为没有写博,所以不记得在网上做了些什么。
    4/30-5/1在伦敦开了一个会,名为“数据模型会议”,实际上是RDA与DC之间的合作,远洋过客在第一时间向我们告知了此事(转贴:Astonishing news: RDA goes 2.0。昨晚逐一看完后续的热烈讨论,脑中全是困惑。今天想着该写点什么,留个脚印,还是放弃了,but I'll certainly follow it with interest.

    长假中外出做了一日游,前天写了篇流水帐,想发到携程上去,给驴友提供些信息。登录后发现留的还是亿唐邮箱,而邮箱更新后,却迟迟没有收到携程发出的确认邮件。好在有个链接,可以通知他们没有收到邮件,说是24小时内处理——可是直到刚才还没有收到。今天是发不成了,难道永远发不成了?

    我的网络生活,基本上都是晚饭后开始的,但今天有件事是名正言顺地上班时间做的:给包租公发出了学报封面选秀照片,并且立刻收到了入选通知 🙂 不要以为那贴子底下没有我的留言就是插了队,那是万二帮着排好队嘀。

    本月接下来的时间大概都不可能有什么网络生活了,因为我要去学习,还有……,就在今天过把瘾。除了明天——刚才万二说,明天有个网络会议,我答应旁听。到QQ群里看会议内容,“敲定lib2.0书的大纲,分解任务”,那是第二次了,上回用的是QQ文字聊天+skype语音会议、SeeHaHa视频直播。前一天我还在那儿掺和测试,正式开会的时候,也不知怎么就错过了。

《中文图书标识数据》(征求意见稿)观感

    耄耋少年博客新开,一连发表了“标识性编目”系列博文,使我对此问题有了一定的了解。规范出版行业需要提供的书目信息,不管从哪个方面来说都是很有必要的,即使这样做的目的是让图书馆的大部分编目员失业。

    正好有幸看到了中华人民共和国新闻出版行业标准《中文图书标识数据》(征求意见稿),觉得特别困惑的就是其主体“4  标识数据”采用CNMARC名称(字段、子字段)与DC元数据表达各著录项。该标准长达56页,说其繁复程度不亚于编目手册,或许也算不得夸张。而“附录3.  中文图书标识数据应用实例”,看上去就是一条常见的CNMARC记录,一点未体现出或者说让人感受到耄耋少年在其博文中所说的标识性编目的优点。总体而言,可以说有见到编目手册的“亲切感”。
   
    如果要对这个行业标准提一些观感,那么就是以下四点:

1、国际出版界电子形式产品信息的标准是ONIX,美国国会图书馆在编目中也使用ONIX数据,我国的相应标准是否应当考虑与其兼容?

2、本标准同时采用MARC与DC,不会意味着出版者必须同时提交两种格式的数据吧?应当是只需一种格式,另一种格式经过转换即可。或许可以认为本标准同时提供两种格式转换的标准(附录1和附录2分别为CNMARC到DC和DC到CNMARC的对应表)。

3、元数据之间的转换不可避免。无论是图书馆现在所用MARC还是未来用某种元数据(不排除DC),只要向出版行业或图书馆提供格式转换软件,数据即具有通用性。不必拘泥于某一元数据格式。

4、标准如果要有长期的指导性,更不应将其局限在某一种元数据格式中。标准只要确定需要哪些项目(如同ISBD的八大项若干小项),至于用什么方式表现这些项目,是用2709格式文本、EXCEL表格、XML格式文本或是其他什么形式,肯定会随技术的发展而改变。

参见耄耋少年的相关博文:
出版界书目工作有大的进展(http://blog.sina.com.cn/u/4bd4c87b010006mw)
“2005年发布了《图书流通信息交换规则》 和CIP相比,明确使用CNMARC格式为信息交换格式”
“自动编目软件已开发成功  自动编目是图书馆界做不了的”
“从源头进行书目数据制作可实现更大范围的信息资源共享  真正做到一家编目,大家使用”

中文图书标识数据(征求意见稿)系列(http://blog.sina.com.cn/u/4bd4c87b010006my)
不知道为什么发布的是7-14,内容为“附录1.  中文图书标识数据使用CNMARC字段、子字段一览表”,而不发布正文部分。寻些CNMARC字段、子字段估计把很多人都弄晕了。

关于《中文图书标识数据》标准 2007-01-12(http://blog.sina.com.cn/u/4bd4c87b010006nj)
“这是出版信息化建设的重要举措。主要为实现在图书出版过程中自动编目规定一个数据内容。这样,在图书付印前,就可以产生符合书目记录要求的数据。此事已酝酿好几年,标准推行后,其中基本部分将以二维码形式印在书上,完整内容将在图书付印前在网上发布。以满足出版社、书商、图书馆与读者对书目信息的需求。”“因为是在电子文本上进行标识,而不是另行描述,所以称之为标识性编目。”

关于ECIP与自动编目(http://blog.sina.com.cn/u/4bd4c87b010006p5)
新制定的《图书流通信息交换规则》及正在制定的《中文图书标识数据》等中均采用CNMARC。

标识性编目概念的提出(http://blog.sina.com.cn/u/4bd4c87b010006qh)
“自动编目处理的是图书付印前的电子文本,对其具有的属性数据进行标识。在制定相关标准时,可要求一种新出版的图书必须具有那些属性数据,使图书制作者有所遵循,在属性数据项目的设置上按规范要求处理。”
“标识性编目不可能代替描述性编目,两者将长期共存。一是正式出版的图书方可先行标识,而文献收藏机构总有部分非正式出版的图书。二是对过去出版的图书,还只能进行描述性编目。”

标识性编目的特点(http://blog.sina.com.cn/u/4bd4c87b010006r8)
“4.真正做到一家编目,大家使用。由于出版单位在图书发行前即提供了标准化的书目数据,发行商与图书馆可不用另行编目了。”

努力做好标识性编目的事情(http://blog.sina.com.cn/u/4bd4c87b010006s7)
“文献编目是社会性事业,出版、发行、图书馆、情报所等都是图书目录的编制者,必须改变“图书馆目录”的狭隘观念。”
“数字图书馆需要解决自动编目的问题,但图书馆界做不了。不能因为图书馆界做不了就不加以研究。”
“加强元数据研究,主要是突破繁琐哲学,在新的条件下,探索可满足检索要求的元数据设置。”[理论与实践怕总是有距离的]