《信息标准季刊》专辑:书目数据交换进展(围绕BIBFRAME)

《信息标准季刊》由美国信息标准组织(NISO)主办、开放获取,2013冬辑为“书目数据交换进展”专题:
ISQ:Information Standards Quarterly (Winter 2013, Vol.25 issue 4)
Topic: Evolution of Bibliographic Data Exchange

本辑邀请OCLC数据服务与WorldCat质量部执行主任Ted Fons作为客座主编(导论p.4-5),主要围绕美国国会图书馆开发中的BIBFRAME并有所扩展,作者分别来自德国、美国和法国,显示国际化视野。第1页是BIBFRAME发展年表和数据模型核心类图,题为:BIBFRAME不仅走、而且跑(LC BIBFRAME: Not Just Walking But Running)。专题包括3篇文章、1篇访谈,另有短文介绍BIBFRAME的潜在竞争对手(Schema Bib Extend),以及NISO自己的书目路标行动报告(Bibliograpic Roadmap Initiative,参见:NISO得到梅隆基金资助,评估新书目框架现状及未来需求,2012年11月9日 )。

(p.6)特写:当前书目模型适合集成到网络么?
Are Current Bibliographic Models Suitable for Integration with the Web? / Lars Svensson (German National Library)
(p.14)观点:取代MARC:从何处开始?
Replacing MARC: Where to Start / Paul Moss (OCLC)
(p.17)实践:变革的机会:BIBFRAME在乔治·华盛顿大学、一个早期实验者
A Transformative Opportunity: BIBFRAME at the George Washington University, an Early Experimenter
(p.22)访谈:访谈法国国家图书馆书目与数字信息部主任吉尔达·艾里恩
Interview with Gildas Illien, Director, Bibliographic and Digital Information Department, Bibliotheque nationale de France (BnF)
(p.30)实践:Schema书目扩展
Schema Bib Extend / Richard Wallis (OCLC)
(p.33)NISO报告:通过新交换环境绘制航线:NISO书目路标行动
Charting a Course through a New Exchange Environment: The Niso Bibliograpic Roadmap Initiative / Todd Carpenter

via: Special Information Standards Quarterly Issue on the Evolution of Bibliographic Data Exchange Published by NISO (16 Dec 2013)

从NISO工作组看当前技术热点

美国信息标准化委员会(NISO)目前有三个专题委员会即商务信息、内容与馆藏管理、发现到传递,每个委员会下面有若干工作组或委员会。”NISO工作组与委员会专辑”,是NISO Newsline季度附刊,提供各工作组、委员会的信息。2013年4月号,包括各工作组/委员会的网络工作空间(Workroom)链接——通常有丰富的资料,以及刚完成或正在制订的标准或推荐实践(Recommended Practices)的情况,或可由此了解当前技术热点。
Working Group Connection. April 2013

———-Business Information Topic Committee 商务信息专题委员会———-
* Demand Driven Acquisitions Working Group 需求驱动采购工作组——有关DDA或PDA的标准
* I2 (Institutional Identifiers) Working Group 机构标识符(I平方)工作组(4月刚发布推荐实践NISO RP-17-2013;工作组与ISNI(国际标准名称标识符)国际局的协作协议是,采用ISNI标准(ISO27729),而不单独发布自己的标识符)
* PIE-J (Presentation & Identification of E-Journals) Working Group 电子期刊展示与识别工作组(3月下旬发布推荐实践NISO RP-16-2013;提供电子期刊展示指导,尤其在题名展示、精确使用ISSN和引用实践方面。希望解决连续出版物馆员长期关注的某些问题,最终帮助用户在联机环境中工作,更方便地使用引文元素获取基于文章的资料)
* SERU (Shared E-Resource Understanding) Standing Committee 共享电子资源理解(SERU)指导委员会( 2012年更新了最初创建于2008年的推荐实践NISO RP-7-2012,使之更灵活地用于电子期刊之外的联机产品)(SERU注册)
* SUSHI (Standardized Usage Statistics Harvesting Initiative) Standing Committee 标准化使用统计收割项目(SUSHI)指导委员会(3月上旬更新的SUSHI标准ANSI/NISO Z39.93-2013,及COUNTER-SUSHI实施文档NISO RP-14-2012)——电子资源使用统计收割
* Z39.7 Data Dictionary Standing Committee 数据字典指导委员会(ANSI/NISO Z39.7)(持续维护中的联机标准“信息服务与利用:图书馆与信息提供者的计量与统计-数据词典”,目的是帮助信息界指明并定义有用的可量化信息,测量图书馆的资源与表现,提供一批有关美国图书馆的有效且可比较的数据;最新更新版已经作为标准修订得到投票批准,只等ANSI批准后出版;相关ISO标准:ISO 2789“国际图书馆统计”和ISO 16439“评估图书馆影响的方法与过程”)——图书馆测评用标准

———-Content & Collection Management Topic Committee 内容与馆藏管理专题委员会———-
* Digital Bookmarking and Annotation Sharing Working Group 数字书签与标注共享工作组(致力于联机引用与标注共享的系统需求与句法规范。在数字环境中(尤其是电子书),需要跨越多种硬件平台、乃至跨越不同版本,定位参引点、共享引用及标注;尚处于起步阶段,界定与“开放标注协作”(Open Annotation Collaboration)间的关系)
* Journal Article Versions (JAV) Addendum Working Group 期刊文章版本(JAV)补遗工作组(2008年开发的期刊文章版本推荐术语集(NISO RP-8-2008)用于一篇文章生命周期中的各个版本(iteration),可作为出版者、图书馆员、集成者、索引者及最终用户的可靠工具。JAV被采纳,但发现“校样”(proof)一词的范围不太准确、难以应用,因而建议发布补遗;小组还将考虑提出可结合JAV术语的元数据框架或词典。计划6个月提出推荐)
* Standardized Markup for Journal Articles (JATS: Journal Article Tag Suite) Working Group 期刊文章标准化标记(JATS:期刊文章标签套件)工作组(2012年下半年出版ANSI/NISO Z39.96-2012,延续NLM期刊存档与交换标签套件3.0版的;已成立与ANSI兼容的持续维护机制JATS指导委员会)(专用网站jats.niso.org;一套描述期刊文章的文本及图像内容的XML元素及属性集,也可用于某些非文章资料如来信、编者按及图书与产品评论)
* NISO/NFAIS Supplemental Journal Article Materials Project 期刊文章补充资料项目(与全国高级信息服务联盟(NFAIS)合作项目,推荐实践2013年上半年发布,说明围绕出版才包含、处理、显示及保存补充期刊文章材料相关问题;由A和B两部分组成,A为商务政策与实践,说明语义与政策问题;B为技术考虑与实施推荐,说明“如何”实施链接、封装和存档)

———-Discovery to Delivery Topic Committee 发现到传递专题委员会———-
* IOTA (Improving OpenURLs Through Analytics) Working Group 通过分析改进OpenURL(IOTA)工作组(评估与比较内容供应者OpenURL实施的质量;面向链接解析器供应者的推荐实践,将于下月经发现到传递专题委员会批准出版;正考虑升级为委员会)(网站:openurlquality.niso.org)
* NISO/UKSG KBART (Knowledge Bases And Related Tools) Phase 2 Working Group 知识库及相关工具(KBART)第2阶段工作组(支持第1阶段推荐实践NISO RP-9-2010;第2阶段推荐实践专门针对电子图书与会议录元数据,及通过联盟封装许可领域;另外探索开放获取资料领域,以及其元数据如何在知识库中出版与共享;第2阶段推荐实践的公示草案计划5月底公布)(KBART注册[在GoogleSite上,有墙])
* NCIP (NISO Circulation Interchange Protocol) Standing Committee NISO流通交换协议(NCIP)指导委员会(2012年出版NCIP最新版2.02;4月会议讨论了通用图书馆通信框架(SIP及其他))
* Open Discovery Initiative Working Group 开放发现项目工作组(ODI致力于定义基于索引检索的新一代图书馆发现服务的标准和/或最佳实践,自2012年1月以来经常开会,近几个月四个子组开展工作:技术格式,图书馆索引权/层次的沟通;公平链接的定义;使用统计。计划5月末形成一个公示草案)
* ResourceSync Working Group 资源同步工作组(研究、开发、原型、测试与布署大规模Web资源同步,意在同步对象本身,不仅仅是其元数据,建立在OAI-PMH策略上。核心小组得到斯隆基金资助,也得到包括其他产业及研究伙伴(部分受JISC赞助)的助力;年初发布公示了beta版规范,希望5月底完成最终规范供投票批准;实施规范包括Python和Jave代码库,以及DSpace专用Java实施,正进行中,马上会提供)
* Specification for Open Access Metadata and Indicators Working Group 开放获取元数据与指示符规格工作组(刚起步。开发标准化书目元数据及可视指示符,除潜在描述期刊文章如何“开放”外,也描述其可获得性;首先聚焦描述与OA文章相关的阅读权的元数据元素)(出版商在开放获取(OA)、增强获取、公共获取或其他描述的旗帜下,含义各不相同。目前没有标准化的书目元数据,能提供特定文章是否免费可读、读者有何重用权的信息;在不同出版商、甚至同一出版商的不同期刊中,表明文章开放性的可视指示符或图标的设计与使用也不一致)
* Standard Interchange Protocol (SIP) Working Group 标准交换协议(SIP)工作组(SIP于1993年由3M引入,允许ILS应用与自助服务设备间无缝通信,已成为世界范围的事实标准。工作组将现SIP 3.0版规范纳入NISO标准,2012年10月启动,考虑4个重要领域,即:SIP3文档本身,包括修订/更正/增补、解决歧义等;维护机构;SIP3相关的隐私标准与安全性;与NCIP的关系)

简化图书元数据工作流程

    2009年3月18-19日,OCLC举办“出版者与馆员会议”(Symposium for Publishers and Librarians),讨论图书元数据问题。美国信息标准化组织(NISO)和OCLC委托Informed Strategies总裁Judy Luther就此撰写白皮书,于会后出版,名《简化图书元数据工作流程》:

Streamlining Book Metadata Workflow / Judy Luther. Baltimore, MD : NISO, 2009. ISBN: 978-1-880124-82-6 (PDF, 22p)                   

    白皮书分析了图书供应链中,元数据创建、交换与使用的现状,以及未来的机会:

Stakeholder Perspectives
    图书供应链中元数据的利益相关人,也就是拥有图书元数据的机构,包括出版社、元数据供应商、批发商、书商、国家图书馆、本地图书馆与Google。
· 出版社:由于按需印刷技术的发展,出版社需要数字化其出版书目。大社提供XML化的ONIX数据,小社可能就是EXCEL表。
· 元数据供应商:包括图书登记机构(如Bowker和Nielsen Book)、编目服务机构(如英国的BDS)、成员组织(如OCLC和CrossRef)。
    Bowker年增加30万条记录,50%是ONIX,45%是EXCEL或其他电子格式,5%仍来自提交的纸质信息。
    英国的BDS外包了大英图书馆的CIP业务,每年提供7.5万记录,并提供ONIX到MARC21的对照。
    OCLC在美加两国有70个元数据专家与编目员,为特藏及出版社、书商创建记录。
    另外主要拥有期刊元数据的CrossRef有160万图书DOI,Serials Solution有100万电子图书记录。
· 批发商:最大的批发商Baker & Taylor和Ingram数据库年增长10%以上。虽然年出版新书约20万种,但新记录估计达70万,因为不同格式与版本要有独立的记录。
· 国家图书馆:LC专业编目员创建或升级了其35万记录中的80%,BL则为26万记录中的55%。据估计,WorldCat记录的65%是简编记录(难怪OCLC要开放“专家社区”,让更多编目专家帮助提升WorldCat的质量)。
· Google:Google数字化成百上万图书,在ONIX与MARC中取质量高的记录。有不少图书馆员在Google工作,Google也与OCLC合作。Google还在开发区分相关作品的算法

Metadata Workflow
    元数据工作流程,包括ONIX及MARC标准,以及书业与图书馆界在元数据质量控制方面的努力。

Opportunities
    未来的机会,包括标识符、主题表及最佳实践

· 标识符:包括作者、个别作品、丛编与相关作品,相当于编目界的名称规范、丛编题名规范,以及FRBR中的作品概念。
    唯一标识文本作品的“国际标准文本码ISTC – International Standard Text Code已是国际标准ISO 21047。
    作者标识符目前有“国际标准名称标识符ISNI – International Standard Name Identifier,还是草案(Draft ISO 27729)。
· 主题表:美国书业采用BISAC,50大类3000多小类;英国书业采用BIC;图书馆界采用LCSH、Sears及MeSH。
· 最佳实践:14项建议,特别注意的是:
第一条:使用ONIX与MARC的对照,方便创建CIP,并向出版社提供XML的MARC数据。
最后一条:探索把目前的ISTC和未来的ISNI标准集成到当前工作流程的方法,促进其被采纳。前者可用于创建作品间关联,后者可提供作者的规范控制。(或许未来的MARC书目记录中会加入ISTC,规范记录中会加入ISNI

    集中同一作品的不同内容表达、载体表现,对于出版发行者来说,可能比图书馆更为重视。因为多卷书(整套或各单册)、不同载体(如电子或纸质)、甚至不同装帧形式(如精装或平装),由于销售方式、销售价格不同,对书商来说需要使用不同的记录。这是以前没有想到过的ONIX数据与MARC数据的一个重要差别。

    无论如何,充分利用供应链上游的数据,将会是未来图书馆编目工作的发展方向。LC对书目控制未来工作组报告的回应,表明LC计划继续参与ONIX开发,并将关注从ONIX中抓取数据的机会。而OCLC的出版社ONIX元数据强化服务,从形式上看是为出版社提供服务,实质上也为WorldCat取得了大量由ONIX元数据转换而来的MARC数据。

    白皮书正文末是Judy Luther与30位业内代表交谈后,绘出的图书元数据交换图(p.17),反映图书供应链中各方及与ONIX、MARC、DOI三种元数据的关系,标示出对数据进行质量控制的部分。


参见:OCLC News Releases, 7 July 2009
Streamlining Book Metadata Workflow – NISO and OCLC Publish White Paper that Reveals Opportunities in the Book Supply Chain