MARC21 as a Data: A Start / By Karen Coyle. Code4Lib Journal, Issue 14, 2011-07-25. ISSN 1940-5758
一、子字段关系类型
以前看远洋师解说词汇间关系,老觉得自己脑子不够用。本文“Finding Patterns”部分对MARC21的子字段与同一字段其他子字段及资源(当指字段)关系的明确划分,也是需要类似的清晰头脑才能分析出来的。
二、控制字段00X
从计算机处理角度,控制字段(主要是006、007、008定长字段)虽显复杂但含义明确,可以直接使用“00X+文献类型+位置”生成标识,如:
007microform05 表示缩微品的压缩比
008map22-23 表示地图的投影
推理:再配以取值词汇表,可以很方便地变成“数据”。
三、字段指示符
MARC21的字段指示符使用非常广泛,这使得同一字段可表达更多的不同含义。0XX数字与代码字段从定义上只能容纳不足100种含义,但由于字段指示符的使用而有很大的扩展余地(如024第1指示符=7标准号类型在$2说明,使包含的标准号类型可任意扩充)。但如此增加了将MARC21记录处理为“数据”的复杂性。
字段指示符还有完全不同的用法:“是或否”──当指050第2指示符LC馆藏;单个值或多个值,如034第1指示符比例尺是单个还是范围,这个被指完全没有必要。
四、被取消的标准号(024字段)
文中对于024中其他子字段与$a依存关系的认识或有不足:
$c获得条件与标准号的依存,是因为在同一条记录中,会有多个号码,不同号码有各自的获得方式(如标价)──即使不同载体如纸本与电子版做多条记录仍是如此,最常见的有精平装、不同卷册,除非一号一记录。由于美国出版物上标价的不多,所以现有记录中少见$c,或许因之Karen不明如此设计的理由?
$z取消号的情况同样如此。所以文中表格的下面部分或许应当更改:
ISRC Cancelled 024 0 $a024$z
UPC Cancelled 024 1 $a024$z
ISMN Cancelled 024 2 $a024$z
EAN Cancelled 024 3 $a024$z
SICI Cancelled 024 4 $a024$z
UNKnown Number Cancelled 024 8 $a024$z
Other number cancelled 024 7 $a024$z 024$2
五、特例(XXX描述字段)
本文更多关注特例字段,或许因为这些字段特别需要花精力分析,只是不免显得MARC21似一无是处了。
1、功能而非语义的240字段
对编目员而言,选择240还是130是考试点;机器则无法理解文中后两例(作品集统一题名)。MARC21其实定义了243字段作品集统一题名,可惜实际应用中多采用240字段,用243的极少。
2、冗余字段的存在是为了提供关联,76X-78X连接款目字段就更是如此。
但在MARC21实践中,如773这类字段实际使用不多,这种形式间有差异的情况,对关联记录是负面的。
六、UNIMARC更胜一筹?
比较而言,UNIMARC字段指示符多为缺省值,其1XX代码字段基本一字段一含义,或许比MARC21语义更清晰些。
由于采用嵌套方式(后来增加的子字段可选方式也一样),连接字段形式不一致问题在UNIMARC中应该不存在。
http://www.ccabbs.net 中国编目联盟|China CataLog Alliance
学习了!子字段、字段指示符、还有背后的规定,都使得数据很难处理成A的样子。现在除了MODS,EAD和VRA Core都是类似的。老恩说的很形象,有一种语言是XML schemas(上面各例),还有一种是RDF vocabularies,就像DCterms等。二者的术语和语义都不同,特别是‘attributes’一词。