用得最多的39个CNMARC字段

    忙中偷闲,抽取本馆2004年的部分CNMARC数据,作了一个类似的字段使用频率统计。总共18418条记录,除本地使用字段外,共使用了90个字段。其中有11个字段只出现了一次,除非书资料外,相信有几个只出现一次的字段为著录错误所致。
    字段计数总共为355680,平均每条记录使用19.3个字段。平均每记录使用字段比前述USMARC统计的18个字段为多也是理所当然的,因为USMARC一个必备的008字段,在CNMARC就至少要用上必备100、101、102,对于数据量最大的专著,还要加上105、106。如此说来,似乎CNMARC记录的总体信息量要少于USMARC记录?可能相对来说,由于后组的原因,CNMARC主题字段数量略少。
    在本次统计中,出现频率超过百分之一的字段为39个,出现频率超过千分之一的有56个字段,出现频率超过万分之一(1次以上)的有79个字段。由于无法统计每条记录的情况,所以可重复字段的出现次数会超过100%。也就是说,即使是统计值为100%的字段,也不一定出现在每条记录中,因为可能有些记录出现多次该字段。以下是39个字段及其统计数据(某些字段应当为100%,如001、100、101、102、200、215,原记录有错误):

701 121.65%
606 118.82%
801 113.93%
690 113.36%
010 105.77%
001 100.01%
210 100.00%
101  99.99%
200  99.99%
102  99.99%
215  99.99%
100  99.98%
106  99.93%
105  99.02%
005  89.14%
410  59.96%
225  54.59%
320  50.96%
702  30.84%
330  27.49%
517  26.81%
510  25.74%
314  12.33%
300  11.70%
312   8.85%
711   7.76%
600   7.18%
306   7.03%
205   5.79%
333   4.75%
305   3.53%
092   2.28%
304   1.87%
712   1.86%
601   1.84%
327   1.79%
605   1.58%
311   1.48%
607   1.05%

    由于专著记录占了数据的绝大部分,所以对于专著以外文献类型记录所用字段,这个统计数据显然是没有帮助的。如连续出版物的110、207、326、310、011字段均未入围,单独统计时,前三个字段的出现率为100%,后二个字段分别是8%和4%。
    这个统计的样本不够大,与前述USMARC统计的400多万没有可比性。但由于采用的是较新的记录,或许更能反映目前CNMARC的使用情况。不过,CNMARC目前应用上有一些分歧,采用不同标准的图书馆,统计结果也会有一定的影响,比如本馆不采用411、461、462字段之类,导致410字段出现频率较高。

 

克特著者号码表知多少?

    见到一个克特著者表网站Cutter Author Tables(http://www.cuttertables.com/),原来目前通用的克特表,除了曾介绍过的LC克特表外,还有如下三种:

1、Cutter&aposs Two-Figure Author Table
2、Cutter&aposs Three-Figure Author Table
3、Cutter-Sanborn Three-Figure Author Table

    国内常用的,就是第三个版本――克特-桑伯恩三位著者号码表。
    这个网站是美国的商业网站,让你去买它的克特表,价格分别是15+、25+和26+8美元(运费+手续费),不知道运至海外是否也这个价。

    终于在网上找到了国内常用克特表的全文,是韩国图书馆员协会网站上提供的:“克特-桑伯恩三位著者号码表”Cutter-Sanborn:http://librarian.or.kr/reference/mark/cutter1.htm。前几天已经加在侧栏的链接中了。
    原来侧栏链接的是厦门大学图书馆编目部网站上的克特表查询系统,试查了几个,结果不大看得懂。

又:韩国图书馆员协会(Korea Librarian Association)网站(http://librarian.or.kr/)似乎内容颇丰,特设Reference一个大类,上述克特表即在其中。只是对朝鲜文一窍不通,无法逐一探寻。

更新(2005年5月8日):
    由gt800800评论知道还有OCLC Four-Figure Cutter Tables。
    查一下,OCLC四位克特表包括Cutter Four-Figure Table and Cutter-Sanborn Four-Figure Table。OCLC还有一款自动给此克特号的软件Dewey Cutter Program可以下载,适用于Windows Millennium, 2000, and XP,可惜我的机器太破没法安装试用。
   进而发现还有1-2位字母+3位数字的克特号,不知正式名称为何。

“多语种叙词表准则”公示

    国际图联IFLA近些年在推出新的指导性文件前,总会先“公示”,听取各方意见。ISBD系列修订如此,现在“多语种叙词表准则”又开始公示了,发表意见截止期为2005年7月31日。
    本准则于2002年开始准备,目的是对现行多语种叙词表标准及叙词表编制手册进行补充。
    开发多语种叙词表有三种途径,本准则只针对前二种途径:

1、重新创建一部新叙词表
    a. 开始用一种语言,随后增加其他语言
    b. 同时用一种以上语言开始
2、组合现有叙词表
    a. 合并二个或以上现有叙词表,形成一个新的多语种信息检索语言,用于标引与检索
    b. 将现有叙词表与标题表相互链接;同时使用现有叙词表和/或标题表,用于标引与检索
3、将一部叙词表翻译为一种或多种其他语言

    如果对此有研究,倒是发表见解的好机会。如果觉得用英文不能完美表达,不妨用中文写,然后发邮件给IFLA分类与标引组主席Dr. Marcia L. Zeng(曾蕾)。

附:
1、多语种叙词表准则 Guidelines for Multilingual thesauri(PDF文件
2、现行多语种叙词表标准与叙词表编制手册:
ISO 5964:1985
Documentation – Guidelines for the establishment and development of multilingual thesauri (介绍
Thesaurus construction: a practical guide / J AITCHISON, A GILCHRIST, D BAWDEN. London : Aslib, 2000