MARC – 第 53 页 – 编目精灵III

用得最多的39个CNMARC字段

    忙中偷闲，抽取本馆2004年的部分CNMARC数据，作了一个类似的字段使用频率统计。总共18418条记录，除本地使用字段外，共使用了90个字段。其中有11个字段只出现了一次，除非书资料外，相信有几个只出现一次的字段为著录错误所致。
    字段计数总共为355680，平均每条记录使用19.3个字段。平均每记录使用字段比前述USMARC统计的18个字段为多也是理所当然的，因为USMARC一个必备的008字段，在CNMARC就至少要用上必备100、101、102，对于数据量最大的专著，还要加上105、106。如此说来，似乎CNMARC记录的总体信息量要少于USMARC记录？可能相对来说，由于后组的原因，CNMARC主题字段数量略少。
    在本次统计中，出现频率超过百分之一的字段为39个，出现频率超过千分之一的有56个字段，出现频率超过万分之一（1次以上）的有79个字段。由于无法统计每条记录的情况，所以可重复字段的出现次数会超过100%。也就是说，即使是统计值为100%的字段，也不一定出现在每条记录中，因为可能有些记录出现多次该字段。以下是39个字段及其统计数据（某些字段应当为100%，如001、100、101、102、200、215，原记录有错误）：

701 121.65%
606 118.82%
801 113.93%
690 113.36%
010 105.77%
001 100.01%
210 100.00%
101 99.99%
200 99.99%
102 99.99%
215 99.99%
100 99.98%
106 99.93%
105 99.02%
005 89.14%
410 59.96%
225 54.59%
320 50.96%
702 30.84%
330 27.49%
517 26.81%
510 25.74%
314 12.33%
300 11.70%
312   8.85%
711   7.76%
600   7.18%
306   7.03%
205   5.79%
333   4.75%
305   3.53%
092   2.28%
304   1.87%
712   1.86%
601   1.84%
327   1.79%
605   1.58%
311   1.48%
607   1.05%

由于专著记录占了数据的绝大部分，所以对于专著以外文献类型记录所用字段，这个统计数据显然是没有帮助的。如连续出版物的110、207、326、310、011字段均未入围，单独统计时，前三个字段的出现率为100%，后二个字段分别是8%和4%。
这个统计的样本不够大，与前述USMARC统计的400多万没有可比性。但由于采用的是较新的记录，或许更能反映目前CNMARC的使用情况。不过，CNMARC目前应用上有一些分歧，采用不同标准的图书馆，统计结果也会有一定的影响，比如本馆不采用411、461、462字段之类，导致410字段出现频率较高。

用得最多的33个USMARC字段

    这是早些年的一个USMARC字段出现频率统计数据。
    “allegro-c图书馆软件”（allegro-C Software für Bibliotheken）对1997年前共400多万条USMARC记录进行了统计，平均每条记录用18个字段。出现频率超过1%的共有33个字段，据称另外还有60多个字段出现过。两者合计，出现过的大概就100个左右，而据统计USMARC字段当时为330个(?)，现在是200来个，看来还有削减的余地。
    根据这个统计数据，现在学MARC 21，重点掌握以下33个字段，可算抓住了要害。或许结果并不意外，目前编目系统设置的专著原编模板，大体也就是这些字段，只是以直观的数据予以表示。
    下表依出现频率为序，四栏数据分别是出现率、可靠性（Z，可用于确认书目记录）、字段和都柏林核心元素。

出现率字段 DC元素
100% Z 245 TITLE
      Z 260 PUBLISHER
      Z 300 ???
        050 SUBJECT
      Z 008 LANGUAGE
             TYPE
?95%    650 SUBJECT
72% Z 100 CREATOR
67% Z 020 IDENTIFIER
        500 DESCRIPTION
63%    082 SUBJECT
50%    043 COVERAGE
49%    504 DESCRIPTION
43% Z 700 CONTRIBUTOR
25%    651 COVERAGE
18% Z 250 ???
        710 CONTRIBUTOR
        490 RELATION
17%    440 RELATION
14%    600 SUBJECT
9.4% 740 TITLE
8.2% 830 RELATION
7.3% 110 CREATOR
( 7%    041 =008/35-37 )LANGUAGE
6%    610 SUBJECT
4%    520 DESCRIPTION
3.8% 130 TITLE
3.3% 505 DESCRIPTION
2% Z 111 ???
1%    653 SUBJECT
        655 SUBJECT
        630 SUBJECT
        060 SUBJECT
        810 RELATION
        730 TITLE
        533 RELATION?

上述统计数据中包含大量旧记录，与目前所用MARC字段情况显然有一定的出入。比如740比例高达9.4%，而246却没有上榜，就是MARC格式一体化之前大量记录留下的痕迹。再比如856字段，1997年该字段才刚出现，据称总共只统计到56次，但如果套录近些年的LC记录，出现频率还是相当高的。

上述统计数据原文后有对DC的看法，可以参见文首的链接。如果和我一样看不懂德语，可以请Free2Professional Translation来翻译:http://ets.freetranslation.com/。
顺便再给自己前面的文章做个广告：多语种在线翻译网站。

重要更新（2005/9/2）
原题“TOP 33: The 33 most frequently used fields in LC USMARC data”，实际应为35个字段。

编目法则一及CNMARC 517字段的著录

《图书馆杂志》2005年第3期居然登了4篇编目方面文章，似乎把今年的编目文章全发完了（不知有没有数量指标？）。推荐邓福泉的”对517字段适用范围的探讨“（第52-54，58页），对此问题的总结全面而颇有见地。作者介绍说，邓福泉”已发表图书馆专业论文百余篇”。从维普查得其自1989年以来发文86篇，基本上都是分编领域之作。其关注之专、数量之大，望尘莫及啊！

不过，编目领域总有很多争议。看此文时，略微总结了一下原因，不外乎对著录条例、MARC格式及目录功能认识上的差异。我对此文的些许异议或补充也源自以上原因：

1、关于交替题名，此文推荐的著录方式是：
200 1 $a西行漫记,$a又名, 红星照耀中国
其实，这种方式不符合CNMARC的定义，不同的$a著录的应当是合订题名，而不是同一题名的不同形式。MARC 21对交替题名也采用著录在245$a中的方式，而不是将交替题名著录到245$b中。

2、关于图书更名后的原题名，此文认提供原题名检索点”纯属画蛇添足”，”毫无实际意义”。其实，提供原题名检索点的目的，是为了让读者在检索旧版本题名时，能了解已有新的版本。这是目录”导航“功能的体现。
根据目前的著录惯例，连续出版物更名后，会在新、旧两条记录下为原题名与新题名互相做连接，但图书并无相应的连接字段，也不会找出旧记录，加上新题名的检索点――因为对读者来说，查新版图书者多半不需要旧版。反之，查旧版者或许并不知道新版的存在，故而需在新版记录中提供旧版题名检索点。

3、补充一个使用517字段的低级错误。常常有编目员不分青红皂白，不管是否有检索意义，一律将200$e其它题名信息（如”理论与实践”）做517。517字段在定义中并非只在有检索意义时才能做，因为第1指示符取0时，表明无检索意义，相当于做附注。然而，对于已在200$e中著录的其它题名信息，显然是无须再做附注的。至于第1指示符用上1（有检索意义），错误就不言而喻了。

著名图书馆学家谢拉的”编目法则一“如是说：”没有编目员会认可任何其他编目员的工作。”我也未能逃脱此一法则。文中还有些处于业内商榷范围的内容，不再赘述。

附1：邓福泉“对517字段适用范围的探讨“大纲
1 应使用517字段著录的题名
1.1 版权页题名
1.2 有独立检索意义的副题名
1.3 有独立检索意义的分卷题名（包括200$i和327$a）
1.4 交替题名（推荐著录于200第二个$a中）
1.5 合订题名（不推荐用423）
1.6 不被用作正题名的全称或简称题名
2 不宜用517字段著录的题名
2.1 经过规范处理的题名（用510或540）
2.2 单本书记录中不同于225字段的丛书名（丛书记录中用相应51X）
2.3 图书更名后的原题名（只做300，不做517）
2.4 连续出版物的变更题名（用430/440）
2.5 繁体字题名（200用简体，繁体字题名只做300，不做517）

附2：《图书馆杂志》2005年第3期其他3篇编目论文信息
李淑芬：1999-2003年我国文献编目研究论文的定量分析
黄京华：西文编目数据套录中需要特别注意的字段的审核
谢蓉：也谈ISBN的不规范现象与图书馆的应对措施