用得最多的33个USMARC字段

    这是早些年的一个USMARC字段出现频率统计数据
    “allegro-c图书馆软件”(allegro-C Software für Bibliotheken)对1997年前共400多万条USMARC记录进行了统计,平均每条记录用18个字段。出现频率超过1%的共有33个字段,据称另外还有60多个字段出现过。两者合计,出现过的大概就100个左右,而据统计USMARC字段当时为330个(?),现在是200来个,看来还有削减的余地。
    根据这个统计数据,现在学MARC 21,重点掌握以下33个字段,可算抓住了要害。或许结果并不意外,目前编目系统设置的专著原编模板,大体也就是这些字段,只是以直观的数据予以表示。
    下表依出现频率为序,四栏数据分别是出现率、可靠性(Z,可用于确认书目记录)、字段和都柏林核心元素。

出现率 字段 DC元素
100%  Z 245  TITLE
      Z 260  PUBLISHER
      Z 300  ???
        050  SUBJECT
      Z 008  LANGUAGE
             TYPE
?95%    650  SUBJECT
 72%  Z 100  CREATOR
 67%  Z 020  IDENTIFIER
        500  DESCRIPTION
 63%    082  SUBJECT
 50%    043  COVERAGE
 49%    504  DESCRIPTION
 43%  Z 700  CONTRIBUTOR
 25%    651  COVERAGE
 18%  Z 250  ???
        710  CONTRIBUTOR
        490  RELATION
 17%    440  RELATION
 14%    600  SUBJECT
  9.4%  740  TITLE
  8.2%  830  RELATION
  7.3%  110  CREATOR
( 7%    041  =008/35-37 )LANGUAGE
  6%    610  SUBJECT
  4%    520  DESCRIPTION
  3.8%  130  TITLE
  3.3%  505  DESCRIPTION
  2%  Z 111  ???
  1%    653  SUBJECT
        655  SUBJECT
        630  SUBJECT
        060  SUBJECT
        810  RELATION
        730  TITLE
        533  RELATION?

    上述统计数据中包含大量旧记录,与目前所用MARC字段情况显然有一定的出入。比如740比例高达9.4%,而246却没有上榜,就是MARC格式一体化之前大量记录留下的痕迹。再比如856字段,1997年该字段才刚出现,据称总共只统计到56次,但如果套录近些年的LC记录,出现频率还是相当高的。

    上述统计数据原文后有对DC的看法,可以参见文首的链接。如果和我一样看不懂德语,可以请Free2Professional Translation来翻译:http://ets.freetranslation.com/
    顺便再给自己前面的文章做个广告:
多语种在线翻译网站

重要更新(2005/9/2)
    原题“TOP 33: The 33 most frequently used fields in LC USMARC data”,实际应为35个字段。