OCLC的新一代编目产品

    OCLC副总裁Lorcan Dempsey是LC书目控制未来工作组成员,但在工作组长达一年多的活动期间,他几乎没有在自己博客上谈论过小组内情。即使在报告发布以后,好象他也没有在博客上发表过自己的意见,印象中只提供过一个OCLC对报告意见的链接。但在小组的报告草案于2007-11-30发布不久,OCLC立刻在网站上挂出了一个名为“新一代编目”(Next Generation Cataloging)的试验计划(DC.Date.Created=2007-12-11),其中引用了报告草案的建议。
    这个新一代编目试点项目,就是抓取来自出版社的ONIX数据并对质量加以强化,以及早加入WorldCat。显然项目的结果是,OCLC将由用户贡献数据的分销商转而成为原始数据供应商──OCLC将此项目归在试验中的产品(ProductWorks),顺便可以看看OCLC琳琅满目的试验中产品。
    项目运作过程:
· 合作出版社/供应商(Ingram图书集团、Hachette图书集团、普林斯顿大学出版社、Taylor and Francis)提供ONIX格式的信息。OCLC将数据转换为MARC格式加入WorldCat,并尽可能通过数据挖掘与数据映射的方式自动强化数据。强化后的元数据以ONIX格式返回给出版社/供应商,以对OCLC的强化作出评估。
· 合作图书馆(芝加哥公共图书馆、凤凰城公共图书馆、MIT图书馆、俄亥俄州立大学图书馆)评价通过上述过程加入到WorldCat中元数据的质量,反馈其用于图书馆技术服务流程的适应性。

    据OCLC负责WorldCat与元数据服务的副总裁Karen Calhoun在不久前举行的“编目未来”会议(The Future of Cataloging: a PALINET Symposium, 29 May 2008)所作主旨发言“转变之旅:从苟延残喘到蓬勃发展”(Traveling Through Transitions: From Surviving to Thriving,PPT),试验计划将于本月结束,目标是在2009财政年度正式发布(p.46)。

    在即将举行的ALA的2008年会上,6月29日将会有一场名为“OCLC编目新方向”(New Directions in Cataloging at OCLC)的专场,介绍新一代编目项目的试验结果。再顺便看一看OCLC在年会上排得满满的四天活动日程,Big O真是牛得让人无话可说。

ONIX记录数据库及Onix/UNIMARC对照表

    加州数字图书馆的 Roy Tennant 收集了10万多条出版社下载的ONIX记录,做了一个检索系统,提供题名、介绍、出版者和ISBN四个检索途径。
    检索结果除了简单的书目信息,一般还有目次与内容简介。当然最令人感兴趣的是它的 raw record,也就是ONIX记录。
    曾经在LC的MARC标准主页见过ONIX/MARC21对照表,所以识得ONIX的字段,但没有见过ONIX记录。就好象见过MARC手册,没见过2709格式。以前没有刻意找过,如今真是得来全不费功夫。

    在 Roy’s Prototype Space——ONIX Records for Libraries,除了上述检索系统,还有相关出版社ONIX记录样本,以及各出版社的获取记录方法页面链接。有鱼还有渔,真是不错。

    想到去ONIX主页逛逛,发现有“ONIX mappings to MARC”,MARC21对照表不但有LC版,还有OCLC的 Bob Pearson 版。尤其令人感兴趣的是还有UNIMARC对照表——ONIX / UNIMARC Mapping 由不列颠图书馆 Alan Danskin 制作。
    点击链接后才发现高兴太早,因为链去的BIC主页改版,对照表踪影全无。Google了一圈,全都只有链接,没有找到原文。或许要想法联系作者,才能得到那个Onix/UNIMARC对照表了。

关于ONIX:
The ONIX for Books Product Information Message is the international standard for representing and communicating book industry product information in electronic form.
Latest general release: Release 2.1 (revision 02)
For users in most countries, the current release is Release 2.1 revision 02, published in 2004, with some minor revisions to documentation in February 2005.

via: Catalogablog (2007-2-8)
ONIX Resource http://catalogablog.blogspot.com/2007/02/onix-resource.html

《中文图书标识数据》的指示符问题

    耄耋少年在“元数据研究思考(1)”中认为,MARC格式中的字段指示符实际上并没有用。并指出《中文图书标识数据》征求意见稿虽然用CNMARC,但是不用字段指示符,不知道图书馆界是否会认可。

    从MARC格式看,MARC21的字段指示符表达的含义其实还是比较丰富的,如说明题名的出处与类型(封面、书脊等),说明附加责任者/题名的类型(相关或分析)等。相对而言,UNIMARC及与之兼容的CNMARC的字段指示符确实用处不大,因为UNIMARC或者用不同的字段来表达不同的含义,或者干脆就不加区分(如相关题名、附加责任者等不区分是否为分析)。这就形成了UNIMARC的指示符基本上都用缺省值的局面,所以一般看来,不用也不会产生什么大的麻烦。
    从书目数据角度,对数据质量有要求的图书馆,从出版发行渠道来的数据基本上是弃之不用的;对数据质量没什么要求的图书馆,哪怕直接由EXCEL表转换来的书目数据也照用不误。至于两者在质量及使用效果上的差异肯定是存在的,但相关的调查怕是很难进行,也没有见到过详细的分析。

    标准固然应该与时俱进,但也要考虑与国际标准的兼容,毕竟我们的书目数据还是有与国外数据进行交换的需要的。在UNIMARC没有改变之前,要求CNMARC先行创新,恐怕难以实现。
    以我之见,如果《中文图书标识数据》要用CNMARC格式,为了看上去更“专业”一些,让推广更顺利或者说得到图书馆编目界的认可,还是应该用指示符——都用缺省值就行了,不过就在标准各处多加一项,说明某某字段用什么指示符而已。有点小麻烦的是,个别字段的指示符国图与CALIS有差异,需要先行协调确认。

    回到《中文图书标识数据》采用CNMARC与DC这个问题。我还是以为类似标准采用国际通行标准如ONIX、今后配套转换程序更好。ONIX中大量的电子商务数据,有助于提高出版社采用的积极性。
    虽然我不了解情况,但把当初CIP没有用CNMARC当作CIP数据未能广为采用的主要原因,怕是说不过去的。如果有心推广使用CIP数据,做个转换成CNMARC的程序,那还不是小菜一碟?

参见:

《中文图书标识数据》(征求意见稿)观感

书蠹精:标识性编目和ONIX