规范档2.0:WorldCat身份档

OCLC一直在不遗余力地深入挖掘他们的联合目录宝库——WorldCat中的数据,xISBN、FictionFinder、Audience Level,过一段时间出现一个成果,每令人赞叹。近日,WorldCat Identities的Beta版发布,内容丰富,可称2.0版的规范档。目前只有个人,很快会收录团体,以后还会包括虚拟的人物、著名的动物角色!
开发团队之首Thom Hickey介绍WorldCat Identities时称,WorldCat身份档的灵感来自FictionFinder、现已寿终正寝的RLG开放联合目录RedLightGreen,以及Janifer Gatenby关于以维基补充虚拟国际规范档(VIAF)的建议。

首页是一个简洁的检索框,下面一片由人物姓氏组成的“云”。Thom Hickey说那是根据馆藏(而不是书目)做出来的,很有意思的是,在前一百位中,有三分之一是作曲家。

找了标签最大的贝多芬,点进去看个人页面细节,令人眼睛一亮,不过好象没看到什么维基。
页面分左右两栏,左栏依次是:
规范名称:Beethoven, Ludwig van 1770-1827
概述 Overview:总共有多少作品、所属类别genres、LCSH、身份roles、LCC和DDC(链接到OCLC DeweyBrowser)
出版时段 Publication Timeline:用直方图表示各年代出版量
关于贝多芬收藏最多的作品 Most widely held works about … 有题名(链接到WC)与作者
贝多芬创作的收藏最多的作品 Most widely held works by … 有题名(链接到WC)、作者、版本数、出版年段、语种、收藏馆数,以及简介
读者对象 Audience Level:从儿童0到专业1,贝多芬是0.64
相关名称:与贝多芬有关的人物(链接到其身份档)及身份
有用的链接:LC规范档,维基百科贝多芬词条

右栏依次是:
封面图片:似乎是收藏最多作品的一个封面
其他名称 Alternative Names:相当于规范档中的参见名称
语种 Languages:各语种(链接到WC)及馆藏数,按降序排
封面 Covers:不知道根据什么原则,选了8张封面图片(链接到WC)

Lorcan Dempsey介绍WorldCat Identities时称由于数据是做练习用的,所以有一些矛盾。作为领导,他还提出了更高的要求。

PS:
AADL的Geek,John Blyberg在发布其新版OPAC(SOPAC)前很长时间没怎么写博。今天做播客时(参:见到了传说中的雨僧),老槐笑称keven仍在写博,如果大家发现他忽然不写了,那么可能过一阵就会有新的系统出现了。这话在Thom Hickey身上也应验了,他在博文中提到因全身心投入WorldCat身份档,最近数月没怎么写博。

ONIX记录数据库及Onix/UNIMARC对照表

    加州数字图书馆的 Roy Tennant 收集了10万多条出版社下载的ONIX记录,做了一个检索系统,提供题名、介绍、出版者和ISBN四个检索途径。
    检索结果除了简单的书目信息,一般还有目次与内容简介。当然最令人感兴趣的是它的 raw record,也就是ONIX记录。
    曾经在LC的MARC标准主页见过ONIX/MARC21对照表,所以识得ONIX的字段,但没有见过ONIX记录。就好象见过MARC手册,没见过2709格式。以前没有刻意找过,如今真是得来全不费功夫。

    在 Roy’s Prototype Space——ONIX Records for Libraries,除了上述检索系统,还有相关出版社ONIX记录样本,以及各出版社的获取记录方法页面链接。有鱼还有渔,真是不错。

    想到去ONIX主页逛逛,发现有“ONIX mappings to MARC”,MARC21对照表不但有LC版,还有OCLC的 Bob Pearson 版。尤其令人感兴趣的是还有UNIMARC对照表——ONIX / UNIMARC Mapping 由不列颠图书馆 Alan Danskin 制作。
    点击链接后才发现高兴太早,因为链去的BIC主页改版,对照表踪影全无。Google了一圈,全都只有链接,没有找到原文。或许要想法联系作者,才能得到那个Onix/UNIMARC对照表了。

关于ONIX:
The ONIX for Books Product Information Message is the international standard for representing and communicating book industry product information in electronic form.
Latest general release: Release 2.1 (revision 02)
For users in most countries, the current release is Release 2.1 revision 02, published in 2004, with some minor revisions to documentation in February 2005.

via: Catalogablog (2007-2-8)
ONIX Resource http://catalogablog.blogspot.com/2007/02/onix-resource.html

《中文图书标识数据》的指示符问题

    耄耋少年在“元数据研究思考(1)”中认为,MARC格式中的字段指示符实际上并没有用。并指出《中文图书标识数据》征求意见稿虽然用CNMARC,但是不用字段指示符,不知道图书馆界是否会认可。

    从MARC格式看,MARC21的字段指示符表达的含义其实还是比较丰富的,如说明题名的出处与类型(封面、书脊等),说明附加责任者/题名的类型(相关或分析)等。相对而言,UNIMARC及与之兼容的CNMARC的字段指示符确实用处不大,因为UNIMARC或者用不同的字段来表达不同的含义,或者干脆就不加区分(如相关题名、附加责任者等不区分是否为分析)。这就形成了UNIMARC的指示符基本上都用缺省值的局面,所以一般看来,不用也不会产生什么大的麻烦。
    从书目数据角度,对数据质量有要求的图书馆,从出版发行渠道来的数据基本上是弃之不用的;对数据质量没什么要求的图书馆,哪怕直接由EXCEL表转换来的书目数据也照用不误。至于两者在质量及使用效果上的差异肯定是存在的,但相关的调查怕是很难进行,也没有见到过详细的分析。

    标准固然应该与时俱进,但也要考虑与国际标准的兼容,毕竟我们的书目数据还是有与国外数据进行交换的需要的。在UNIMARC没有改变之前,要求CNMARC先行创新,恐怕难以实现。
    以我之见,如果《中文图书标识数据》要用CNMARC格式,为了看上去更“专业”一些,让推广更顺利或者说得到图书馆编目界的认可,还是应该用指示符——都用缺省值就行了,不过就在标准各处多加一项,说明某某字段用什么指示符而已。有点小麻烦的是,个别字段的指示符国图与CALIS有差异,需要先行协调确认。

    回到《中文图书标识数据》采用CNMARC与DC这个问题。我还是以为类似标准采用国际通行标准如ONIX、今后配套转换程序更好。ONIX中大量的电子商务数据,有助于提高出版社采用的积极性。
    虽然我不了解情况,但把当初CIP没有用CNMARC当作CIP数据未能广为采用的主要原因,怕是说不过去的。如果有心推广使用CIP数据,做个转换成CNMARC的程序,那还不是小菜一碟?

参见:

《中文图书标识数据》(征求意见稿)观感

书蠹精:标识性编目和ONIX