ONIX记录数据库及Onix/UNIMARC对照表

    加州数字图书馆的 Roy Tennant 收集了10万多条出版社下载的ONIX记录,做了一个检索系统,提供题名、介绍、出版者和ISBN四个检索途径。
    检索结果除了简单的书目信息,一般还有目次与内容简介。当然最令人感兴趣的是它的 raw record,也就是ONIX记录。
    曾经在LC的MARC标准主页见过ONIX/MARC21对照表,所以识得ONIX的字段,但没有见过ONIX记录。就好象见过MARC手册,没见过2709格式。以前没有刻意找过,如今真是得来全不费功夫。

    在 Roy’s Prototype Space——ONIX Records for Libraries,除了上述检索系统,还有相关出版社ONIX记录样本,以及各出版社的获取记录方法页面链接。有鱼还有渔,真是不错。

    想到去ONIX主页逛逛,发现有“ONIX mappings to MARC”,MARC21对照表不但有LC版,还有OCLC的 Bob Pearson 版。尤其令人感兴趣的是还有UNIMARC对照表——ONIX / UNIMARC Mapping 由不列颠图书馆 Alan Danskin 制作。
    点击链接后才发现高兴太早,因为链去的BIC主页改版,对照表踪影全无。Google了一圈,全都只有链接,没有找到原文。或许要想法联系作者,才能得到那个Onix/UNIMARC对照表了。

关于ONIX:
The ONIX for Books Product Information Message is the international standard for representing and communicating book industry product information in electronic form.
Latest general release: Release 2.1 (revision 02)
For users in most countries, the current release is Release 2.1 revision 02, published in 2004, with some minor revisions to documentation in February 2005.

via: Catalogablog (2007-2-8)
ONIX Resource http://catalogablog.blogspot.com/2007/02/onix-resource.html

Scopus的作者规范与分面检索

    去年五月,看到“Scopus Author Identifier”的报道,觉得是一种作者的规范。访问Scopus网站,可惜相关资料只限订户观看。不几日发现本馆正在试用Scopus,正好登录进去一看究竟。

    数据库试用时对Scopus的介绍:
    SCOPUS 是 Elsevier 公司的文摘索引数据库,它收录了 13450 种经同行评议的出版物 (主要为期刊) ,学科覆盖数学、物理学、化学、生物学、生命科学、农业、地球和环境科学、工程、心理学、社会科学等领域。
    SCOPUS 数据库还有以下几个主要特点:
1 . 可以检索论文被其它文献引用的情况;
2 . 可以检索到上至 19 世纪发表的文章;
3 . 可以检索到互联网上的相关文献。
用户可通过 Scopus 网页右上方红色的“ Register ”进行个人注册,从而利用 Scopus 中的 Alert 推送服务。

    今天想起此事,把当时的截屏在此存个档:
1、在基本检索与高级检索之外,单独设作者检索,比较特别。并且作者检索也可以设置推送,可用于跟踪特定作者的检索。

Scopus Author search

2、作者检出结果注明作者的主题领域以及所在单位,便于区分同名者。除列出命中文献数量外,还有作者详细信息链接。

Scopus Author result

3、作者详细信息页面左栏有两部分,Personal 列出作者名称的其他形式等关于其本身的信息,相当于名称规范档;Research 部分有其收录文献数、被引数及合作者数及其链接。右栏是 Documents 的详细列表,可直接链接到文摘信息 Abstract+Refs。

Scopus Author details

    看 Scopus 网站上的最新演示,检索界面不见了 Author Search,不知道是不是演示版的简化。另有新发现,也可能是以前没有注意到:

Scopus Refine results
1、有 Full Text 链接。演示没有说明这个文摘索引库中的全文由何而来。
2、检索结果页面上方的 Refine Results,提示与本次检索有关的内容,供进一步限定 limit to 或排除 exclude。共有五个面:出处/题名、作者、发表年、文献类型和主题领域。分面检索潮流中的又一个例子。

《中文图书标识数据》的指示符问题

    耄耋少年在“元数据研究思考(1)”中认为,MARC格式中的字段指示符实际上并没有用。并指出《中文图书标识数据》征求意见稿虽然用CNMARC,但是不用字段指示符,不知道图书馆界是否会认可。

    从MARC格式看,MARC21的字段指示符表达的含义其实还是比较丰富的,如说明题名的出处与类型(封面、书脊等),说明附加责任者/题名的类型(相关或分析)等。相对而言,UNIMARC及与之兼容的CNMARC的字段指示符确实用处不大,因为UNIMARC或者用不同的字段来表达不同的含义,或者干脆就不加区分(如相关题名、附加责任者等不区分是否为分析)。这就形成了UNIMARC的指示符基本上都用缺省值的局面,所以一般看来,不用也不会产生什么大的麻烦。
    从书目数据角度,对数据质量有要求的图书馆,从出版发行渠道来的数据基本上是弃之不用的;对数据质量没什么要求的图书馆,哪怕直接由EXCEL表转换来的书目数据也照用不误。至于两者在质量及使用效果上的差异肯定是存在的,但相关的调查怕是很难进行,也没有见到过详细的分析。

    标准固然应该与时俱进,但也要考虑与国际标准的兼容,毕竟我们的书目数据还是有与国外数据进行交换的需要的。在UNIMARC没有改变之前,要求CNMARC先行创新,恐怕难以实现。
    以我之见,如果《中文图书标识数据》要用CNMARC格式,为了看上去更“专业”一些,让推广更顺利或者说得到图书馆编目界的认可,还是应该用指示符——都用缺省值就行了,不过就在标准各处多加一项,说明某某字段用什么指示符而已。有点小麻烦的是,个别字段的指示符国图与CALIS有差异,需要先行协调确认。

    回到《中文图书标识数据》采用CNMARC与DC这个问题。我还是以为类似标准采用国际通行标准如ONIX、今后配套转换程序更好。ONIX中大量的电子商务数据,有助于提高出版社采用的积极性。
    虽然我不了解情况,但把当初CIP没有用CNMARC当作CIP数据未能广为采用的主要原因,怕是说不过去的。如果有心推广使用CIP数据,做个转换成CNMARC的程序,那还不是小菜一碟?

参见:

《中文图书标识数据》(征求意见稿)观感

书蠹精:标识性编目和ONIX