“MARC21作为数据初步”读后感

MARC21 as a Data: A Start / By Karen Coyle. Code4Lib Journal, Issue 14, 2011-07-25. ISSN 1940-5758
一、子字段关系类型
以前看远洋师解说词汇间关系,老觉得自己脑子不够用。本文“Finding Patterns”部分对MARC21的子字段与同一字段其他子字段及资源(当指字段)关系的明确划分,也是需要类似的清晰头脑才能分析出来的。
Figure 1.Types of Relationships Between MARC Subfields
二、控制字段00X
从计算机处理角度,控制字段(主要是006、007、008定长字段)虽显复杂但含义明确,可以直接使用“00X+文献类型+位置”生成标识,如:
007microform05 表示缩微品的压缩比
008map22-23 表示地图的投影
推理:再配以取值词汇表,可以很方便地变成“数据”。
三、字段指示符
MARC21的字段指示符使用非常广泛,这使得同一字段可表达更多的不同含义。0XX数字与代码字段从定义上只能容纳不足100种含义,但由于字段指示符的使用而有很大的扩展余地(如024第1指示符=7标准号类型在$2说明,使包含的标准号类型可任意扩充)。但如此增加了将MARC21记录处理为“数据”的复杂性。
字段指示符还有完全不同的用法:“是或否”──当指050第2指示符LC馆藏;单个值或多个值,如034第1指示符比例尺是单个还是范围,这个被指完全没有必要。
四、被取消的标准号(024字段)
文中对于024中其他子字段与$a依存关系的认识或有不足:
$c获得条件与标准号的依存,是因为在同一条记录中,会有多个号码,不同号码有各自的获得方式(如标价)──即使不同载体如纸本与电子版做多条记录仍是如此,最常见的有精平装、不同卷册,除非一号一记录。由于美国出版物上标价的不多,所以现有记录中少见$c,或许因之Karen不明如此设计的理由?
$z取消号的情况同样如此。所以文中表格的下面部分或许应当更改:
ISRC Cancelled     024 0  $a024$z
UPC Cancelled     024 1  $a024$z
ISMN Cancelled     024 2  $a024$z
EAN Cancelled     024 3  $a024$z
SICI Cancelled     024 4  $a024$z
UNKnown Number Cancelled     024 8  $a024$z
Other number cancelled     024 7  $a024$z 024$2
五、特例(XXX描述字段)
本文更多关注特例字段,或许因为这些字段特别需要花精力分析,只是不免显得MARC21似一无是处了。

1、功能而非语义的240字段

对编目员而言,选择240还是130是考试点;机器则无法理解文中后两例(作品集统一题名)。MARC21其实定义了243字段作品集统一题名,可惜实际应用中多采用240字段,用243的极少。
2、冗余字段的存在是为了提供关联,76X-78X连接款目字段就更是如此。
但在MARC21实践中,如773这类字段实际使用不多,这种形式间有差异的情况,对关联记录是负面的。
六、UNIMARC更胜一筹?
比较而言,UNIMARC字段指示符多为缺省值,其1XX代码字段基本一字段一含义,或许比MARC21语义更清晰些。
由于采用嵌套方式(后来增加的子字段可选方式也一样),连接字段形式不一致问题在UNIMARC中应该不存在。

OPAC、电子阅读、图书馆2.0、套录

OPAC、电子阅读、图书馆2.0、套录四个词,相互间没什么关系。因为Roy Tennant博文“弃用七词”(7 Words or Phrases to Never Say or Write Again, Mar 17, 2011)中,对这四个词我比较有兴趣,因之以为标题。Tennant在文中用语夸张地表示了对7个词的反感甚至厌恶,在他看来,在数字图书馆时代这几个词早就失去其使用价值,却至今无法摆脱,因此在文后郑重其事地“立誓”弃用。
OPAC 联机公共目录
主要针对其中的Public Access部分──确是历史陈迹了。
Webmaster 网管
这个是对Master(主人)不爽──中文译成网管(网站管理员),还是很贴切的。
E-Reading 电子阅读
中心意思是阅读与设备无关。
Bibliographic Instruction 书目指导
“在这星球上谁会冲过去参加书目指导?”“别在人前说出来,免受鄙视。”
Library 2.0 图书馆2.0
提名放到“历史的垃圾桶”里。他承认该词“是指以不同的方式做事”。并说,虽然“图书馆2.0”从未这样说,但他感觉(用这个词就)好象“图书馆2.0”人群到来之前,图书馆是个不变的机构。──不能说他太敏感,只能说这个词容易让人有这种联想,因此打击面太大了。
Copy cataloging 套录编目
没有直接说出来的话是:有OCLC的网络级系统,还要本地系统干吗?皮之不存、毛将焉附。
Cybrarian 网络馆员
其实已经是个过气的词了,不提也罢。
上述七词完全是通过Twitter杂凑的,因而会从过气的Cybrarian到正火的E-reading。
所谓“无用”却无法摆脱,也从某种角度说明现实。
有些词本是约定俗成,可以转义的,在语言发展史上也不少见。如OPAC,完全可以改为小写,指图书馆的联机目录。当前的图书馆目录固然可以直接用Online Catalog,以Tennant的观点,大概Online也没有意义,直接用Catalog就行,但Catalog含义广泛,要解释是图书馆的目录,又得加上很多修饰──不过,对于服务于OCLC的Tennant来说,图书馆目录本身也是没有意义的,只要OCLC的网络级目录就行了。
Tennant一方面自言参与了图书馆35年的变化,看到他所谓的“少壮派”用“图书馆2.0”反抗现状很是不爽,另一方面却又对图书馆界沿用旧词不思改变愤得很。矛盾吗?
立场啊,立场,无人能免俗。比如我,觉得以上7词中,“书目指导”最该放入“历史的垃圾桶”……

RDA学习笔记十(附录)

RDA词汇表(术语定义)在最后,之前是12个附录。
附录A-L
A 大写
英语:基本依照《芝加哥风格手册》(Chicago Manual of Style),部分修改以符合书目记录需求及长期编目实践。
其他语种规则[西方语种]
B 缩写
含:拉丁字母、西里尔字母、希腊字母、希伯亚和伊第绪语缩写
附:澳大利亚、加拿大和美国州/省/区名称缩写表
C 首冠词
含:各语种冠词表,冠词字顺及对应语种表
D 描述性数据句法
ISBD展示:ISBD项/元素与标点及相应RDA元素对照表[根据2007年版的8大项,无第0项,在注释中说明GMD将被新版第0项取代]
MARC21书目数据格式(MARC21书目到RDA映射表)
E 检索点控制句法
检索点展示:AACR2检索点元素与标点及相应RDA元素对照表
MARC21规范数据格式((MARC21规范到RDA映射表)
F 个人名称附加指引
包括:阿拉伯字母、缅甸、中国(含非汉字名)、冰岛、印度、印尼、马来、罗马、罗马尼亚及泰国人名
其他语种人名处理方式见IFLA的UBCIM项目(世界书目控制与国际MARC)的个人名称调查《个人名称:目录款目的国家用法》
附:含冠词或前缀及其复合的姓氏[西方语种]
G 头衔
法国、伊班人、印尼、英国
H 公历日期
如何使用B.C.和A.D.
I 关系指示词:资源与相关个人、家族和团体间关系(FRBR第1组与第2组实体相互关系)
作品关系指示词(创作者、其他)
内容表达关系指示词
载体表现关系指示词(制造者、出版者、发行者)
单件关系指示词(拥有者、其他)
J 关系指示词:作品、内容表达、载体表现和单件间关系(FRBR第1组实体内部关系)
相关、衍生、描述、整体-部分、伴随、顺序、等同关系
K 关系指示词:个人、家族和团体间关系(FRBR第2组实体内部关系)
关系指示词是暂时性的,在首发后评审、按需修订并确定
L关系指示词:概念、对象、事件和地点间关系(FRBR第3组实体内部关系)
(内容为空)