编目精灵III

    这是早些年的一个USMARC字段出现频率统计数据。
    “allegro-c图书馆软件”（allegro-C Software für Bibliotheken）对1997年前共400多万条USMARC记录进行了统计，平均每条记录用18个字段。出现频率超过1%的共有33个字段，据称另外还有60多个字段出现过。两者合计，出现过的大概就100个左右，而据统计USMARC字段当时为330个(?)，现在是200来个，看来还有削减的余地。
    根据这个统计数据，现在学MARC 21，重点掌握以下33个字段，可算抓住了要害。或许结果并不意外，目前编目系统设置的专著原编模板，大体也就是这些字段，只是以直观的数据予以表示。
    下表依出现频率为序，四栏数据分别是出现率、可靠性（Z，可用于确认书目记录）、字段和都柏林核心元素。

出现率字段 DC元素
100% Z 245 TITLE
      Z 260 PUBLISHER
      Z 300 ???
        050 SUBJECT
      Z 008 LANGUAGE
             TYPE
?95%    650 SUBJECT
72% Z 100 CREATOR
67% Z 020 IDENTIFIER
        500 DESCRIPTION
63%    082 SUBJECT
50%    043 COVERAGE
49%    504 DESCRIPTION
43% Z 700 CONTRIBUTOR
25%    651 COVERAGE
18% Z 250 ???
        710 CONTRIBUTOR
        490 RELATION
17%    440 RELATION
14%    600 SUBJECT
9.4% 740 TITLE
8.2% 830 RELATION
7.3% 110 CREATOR
( 7%    041 =008/35-37 )LANGUAGE
6%    610 SUBJECT
4%    520 DESCRIPTION
3.8% 130 TITLE
3.3% 505 DESCRIPTION
2% Z 111 ???
1%    653 SUBJECT
        655 SUBJECT
        630 SUBJECT
        060 SUBJECT
        810 RELATION
        730 TITLE
        533 RELATION?

上述统计数据中包含大量旧记录，与目前所用MARC字段情况显然有一定的出入。比如740比例高达9.4%，而246却没有上榜，就是MARC格式一体化之前大量记录留下的痕迹。再比如856字段，1997年该字段才刚出现，据称总共只统计到56次，但如果套录近些年的LC记录，出现频率还是相当高的。

上述统计数据原文后有对DC的看法，可以参见文首的链接。如果和我一样看不懂德语，可以请Free2Professional Translation来翻译:http://ets.freetranslation.com/。
顺便再给自己前面的文章做个广告：多语种在线翻译网站。

重要更新（2005/9/2）
原题“TOP 33: The 33 most frequently used fields in LC USMARC data”，实际应为35个字段。

归档

用得最多的33个USMARC字段