这是早些年的一个USMARC字段出现频率统计数据。
“allegro-c图书馆软件”(allegro-C Software für Bibliotheken)对1997年前共400多万条USMARC记录进行了统计,平均每条记录用18个字段。出现频率超过1%的共有33个字段,据称另外还有60多个字段出现过。两者合计,出现过的大概就100个左右,而据统计USMARC字段当时为330个(?),现在是200来个,看来还有削减的余地。
根据这个统计数据,现在学MARC 21,重点掌握以下33个字段,可算抓住了要害。或许结果并不意外,目前编目系统设置的专著原编模板,大体也就是这些字段,只是以直观的数据予以表示。
下表依出现频率为序,四栏数据分别是出现率、可靠性(Z,可用于确认书目记录)、字段和都柏林核心元素。
出现率 字段 DC元素
100% Z 245 TITLE
Z 260 PUBLISHER
Z 300 ???
050 SUBJECT
Z 008 LANGUAGE
TYPE
?95% 650 SUBJECT
72% Z 100 CREATOR
67% Z 020 IDENTIFIER
500 DESCRIPTION
63% 082 SUBJECT
50% 043 COVERAGE
49% 504 DESCRIPTION
43% Z 700 CONTRIBUTOR
25% 651 COVERAGE
18% Z 250 ???
710 CONTRIBUTOR
490 RELATION
17% 440 RELATION
14% 600 SUBJECT
9.4% 740 TITLE
8.2% 830 RELATION
7.3% 110 CREATOR
( 7% 041 =008/35-37 )LANGUAGE
6% 610 SUBJECT
4% 520 DESCRIPTION
3.8% 130 TITLE
3.3% 505 DESCRIPTION
2% Z 111 ???
1% 653 SUBJECT
655 SUBJECT
630 SUBJECT
060 SUBJECT
810 RELATION
730 TITLE
533 RELATION?
上述统计数据中包含大量旧记录,与目前所用MARC字段情况显然有一定的出入。比如740比例高达9.4%,而246却没有上榜,就是MARC格式一体化之前大量记录留下的痕迹。再比如856字段,1997年该字段才刚出现,据称总共只统计到56次,但如果套录近些年的LC记录,出现频率还是相当高的。
上述统计数据原文后有对DC的看法,可以参见文首的链接。如果和我一样看不懂德语,可以请Free2Professional Translation来翻译:http://ets.freetranslation.com/。
顺便再给自己前面的文章做个广告:多语种在线翻译网站。
重要更新(2005/9/2)
原题“TOP 33: The 33 most frequently used fields in LC USMARC data”,实际应为35个字段。