简化图书元数据工作流程

    2009年3月18-19日,OCLC举办“出版者与馆员会议”(Symposium for Publishers and Librarians),讨论图书元数据问题。美国信息标准化组织(NISO)和OCLC委托Informed Strategies总裁Judy Luther就此撰写白皮书,于会后出版,名《简化图书元数据工作流程》:

Streamlining Book Metadata Workflow / Judy Luther. Baltimore, MD : NISO, 2009. ISBN: 978-1-880124-82-6 (PDF, 22p)                   

    白皮书分析了图书供应链中,元数据创建、交换与使用的现状,以及未来的机会:

Stakeholder Perspectives
    图书供应链中元数据的利益相关人,也就是拥有图书元数据的机构,包括出版社、元数据供应商、批发商、书商、国家图书馆、本地图书馆与Google。
· 出版社:由于按需印刷技术的发展,出版社需要数字化其出版书目。大社提供XML化的ONIX数据,小社可能就是EXCEL表。
· 元数据供应商:包括图书登记机构(如Bowker和Nielsen Book)、编目服务机构(如英国的BDS)、成员组织(如OCLC和CrossRef)。
    Bowker年增加30万条记录,50%是ONIX,45%是EXCEL或其他电子格式,5%仍来自提交的纸质信息。
    英国的BDS外包了大英图书馆的CIP业务,每年提供7.5万记录,并提供ONIX到MARC21的对照。
    OCLC在美加两国有70个元数据专家与编目员,为特藏及出版社、书商创建记录。
    另外主要拥有期刊元数据的CrossRef有160万图书DOI,Serials Solution有100万电子图书记录。
· 批发商:最大的批发商Baker & Taylor和Ingram数据库年增长10%以上。虽然年出版新书约20万种,但新记录估计达70万,因为不同格式与版本要有独立的记录。
· 国家图书馆:LC专业编目员创建或升级了其35万记录中的80%,BL则为26万记录中的55%。据估计,WorldCat记录的65%是简编记录(难怪OCLC要开放“专家社区”,让更多编目专家帮助提升WorldCat的质量)。
· Google:Google数字化成百上万图书,在ONIX与MARC中取质量高的记录。有不少图书馆员在Google工作,Google也与OCLC合作。Google还在开发区分相关作品的算法

Metadata Workflow
    元数据工作流程,包括ONIX及MARC标准,以及书业与图书馆界在元数据质量控制方面的努力。

Opportunities
    未来的机会,包括标识符、主题表及最佳实践

· 标识符:包括作者、个别作品、丛编与相关作品,相当于编目界的名称规范、丛编题名规范,以及FRBR中的作品概念。
    唯一标识文本作品的“国际标准文本码ISTC – International Standard Text Code已是国际标准ISO 21047。
    作者标识符目前有“国际标准名称标识符ISNI – International Standard Name Identifier,还是草案(Draft ISO 27729)。
· 主题表:美国书业采用BISAC,50大类3000多小类;英国书业采用BIC;图书馆界采用LCSH、Sears及MeSH。
· 最佳实践:14项建议,特别注意的是:
第一条:使用ONIX与MARC的对照,方便创建CIP,并向出版社提供XML的MARC数据。
最后一条:探索把目前的ISTC和未来的ISNI标准集成到当前工作流程的方法,促进其被采纳。前者可用于创建作品间关联,后者可提供作者的规范控制。(或许未来的MARC书目记录中会加入ISTC,规范记录中会加入ISNI

    集中同一作品的不同内容表达、载体表现,对于出版发行者来说,可能比图书馆更为重视。因为多卷书(整套或各单册)、不同载体(如电子或纸质)、甚至不同装帧形式(如精装或平装),由于销售方式、销售价格不同,对书商来说需要使用不同的记录。这是以前没有想到过的ONIX数据与MARC数据的一个重要差别。

    无论如何,充分利用供应链上游的数据,将会是未来图书馆编目工作的发展方向。LC对书目控制未来工作组报告的回应,表明LC计划继续参与ONIX开发,并将关注从ONIX中抓取数据的机会。而OCLC的出版社ONIX元数据强化服务,从形式上看是为出版社提供服务,实质上也为WorldCat取得了大量由ONIX元数据转换而来的MARC数据。

    白皮书正文末是Judy Luther与30位业内代表交谈后,绘出的图书元数据交换图(p.17),反映图书供应链中各方及与ONIX、MARC、DOI三种元数据的关系,标示出对数据进行质量控制的部分。


参见:OCLC News Releases, 7 July 2009
Streamlining Book Metadata Workflow – NISO and OCLC Publish White Paper that Reveals Opportunities in the Book Supply Chain