RDA官方PPT(2011上半年)

JSC网站发布近期RDA相关会议PPT(Presentations on RDA),说明是JSC成员、RDA延伸组成员及其他RDA开发相关人员所作报告,可视为官方PPT。

2011年上半年基本上是Barbara B. Tillett和Judith A. Kuhagen二人在不同会议上的报告。除美国各地图书馆协会或专业协会的会议外,Barbara于6月8日在德国国家图书馆介绍了RDA美国测试,5月30到6月1日在意大利佛罗伦萨大学讲了三天──记得去年“RDA在欧洲”会议时,意大利刚出版了新的编目条例,几乎是欧洲的国家图书馆中唯一对RDA不感兴趣的。

从标题与PPT内容看,二人所讲互有重复(采用相同底本),部分PPT有详尽备注,不至让人光看幻灯片而不知所云。几个会议的特点:
意大利的“RDA研讨会”三天中的内容比较完整;
德州图书馆协会“RDA会前会”(4月12日)有两个关联数据与语义网内容(VIAF占主要部分,也有RDA注册)。
美国专业图书馆协会“RDA概述”会议(6月14日)的“内容标准、RDA测试、你的准备”(The Content Standard, US RDA Test, Your preparations)则几乎综合了各种内容(130页)。

大致看过,延伸备忘若干:
1、RDA工作文档Working Documents
6JSC起首的为RDA发布后提出的修改与建议
2、参考资料Webliography
3、RDA测试记录下载RDA Test Record Downloads
4、Gordon Dunsire的PPT
Gordon Dunsire为IFLA分类索引部、FRBR评审组、ISBD/XML研究组成员,命名域工作组主席;大英图书馆/CILIP之RDA委员会、RDA延伸组成员,DCMI/RDA工作组共同主席;MODS编委会成员。
其PPT多涉及语义网/关联数据。上述RDA报告中对现有书目记录到FRBR记录演变的动态演示基于其PPT(多个PPT中有)。

RDA最要记住的12件事(TOP 12)

RDA声称其基础有二,一是FRBR/FRAD,一是ICP。RDA在结构上基于FR模型,FR的影响显而易见。相较而言,ICP的影响就不那么明显直接。这几天正在想这个问题,看6月1日Judith A. Kuhagen在NASIG(北美连续出版物兴趣组)会前会上的“最要记住的12件事”,略有所得(5月30日到6月1日Barbara B. Tillett在意大利佛罗伦萨大学“RDA研讨会”、5月4日两人在马里兰图书馆协会会前会“RDA来了、你准备好了吗”上有相同内容)。见:Presentations on RDA (2011)

“Top Twelve” things to remember [ppt]

#1 用户需求/用户任务:查找、识别、选择、获取
说明:源自ICP(国际编目原则声明)总原则一“用户的便利性”(在对著录以及用以检索的名称的受控形式作出抉择时应该考虑到用户)。需要编目员判断,在核心元素之外,是否还需要其他数据以满足用户任务。

#2 “用所见形式”(表达性原则)
说明:ICP总原则三(著录以及名称的受控形式应按实体描述其本身的方式来确定)。

#3 基于元素的描述:方便重用元数据、元素集及控制词汇的注册、更多采用已有数据(如ONIX)
说明:当指不是基于“记录”

#4 作品、内容表达、载体表现、单件(WEMI)
说明:FRBR第一组实体,所描述资源的方面

#5 “核心”与“如果……核心”元素:可增加(与#1相关)

#6 替代、可选省略、可选增加(与#1相关)
说明:由各单位自己选择决定。未来数月将分析LC为RDA测试所作的初步决定以决定未来的实践[LCPS吧]。

#7 更少缩写(与#1和#2有关)
说明:更方便用户理解

#8 关系、关系、关系(多超出核心元素)
说明:指明关系以在书目系统中更好导航[ICP目录功能,在4个FRBR用户任务上增加:查找、识别、选择、获取及导航。RDA未采用“导航”。]

#9 内容、媒介、载体类型
说明:取代GMD(一般资料标识)。希望未来的系统能够用于显示相应图标、作为其他可视显示的依据,过滤或限定检索,对资源分组。

#10 取消“3的规则”──由编目员判断
说明:“3的规则”成为替代做法

#11 信息源扩大
说明:一般而言,任何来源均可用于识别数据。对某些元素,给出优先顺序的信息源

#12 识别特征(元素及关系)作为未来系统的基础:与厂商讨论新系统需求
说明:留待系统开发商使用RDA元素集与控制词表的结构与关系,为用户及方便编目员而建立更复杂的系统。

“MARC21作为数据初步”读后感

MARC21 as a Data: A Start / By Karen Coyle. Code4Lib Journal, Issue 14, 2011-07-25. ISSN 1940-5758
一、子字段关系类型
以前看远洋师解说词汇间关系,老觉得自己脑子不够用。本文“Finding Patterns”部分对MARC21的子字段与同一字段其他子字段及资源(当指字段)关系的明确划分,也是需要类似的清晰头脑才能分析出来的。
Figure 1.Types of Relationships Between MARC Subfields
二、控制字段00X
从计算机处理角度,控制字段(主要是006、007、008定长字段)虽显复杂但含义明确,可以直接使用“00X+文献类型+位置”生成标识,如:
007microform05 表示缩微品的压缩比
008map22-23 表示地图的投影
推理:再配以取值词汇表,可以很方便地变成“数据”。
三、字段指示符
MARC21的字段指示符使用非常广泛,这使得同一字段可表达更多的不同含义。0XX数字与代码字段从定义上只能容纳不足100种含义,但由于字段指示符的使用而有很大的扩展余地(如024第1指示符=7标准号类型在$2说明,使包含的标准号类型可任意扩充)。但如此增加了将MARC21记录处理为“数据”的复杂性。
字段指示符还有完全不同的用法:“是或否”──当指050第2指示符LC馆藏;单个值或多个值,如034第1指示符比例尺是单个还是范围,这个被指完全没有必要。
四、被取消的标准号(024字段)
文中对于024中其他子字段与$a依存关系的认识或有不足:
$c获得条件与标准号的依存,是因为在同一条记录中,会有多个号码,不同号码有各自的获得方式(如标价)──即使不同载体如纸本与电子版做多条记录仍是如此,最常见的有精平装、不同卷册,除非一号一记录。由于美国出版物上标价的不多,所以现有记录中少见$c,或许因之Karen不明如此设计的理由?
$z取消号的情况同样如此。所以文中表格的下面部分或许应当更改:
ISRC Cancelled     024 0  $a024$z
UPC Cancelled     024 1  $a024$z
ISMN Cancelled     024 2  $a024$z
EAN Cancelled     024 3  $a024$z
SICI Cancelled     024 4  $a024$z
UNKnown Number Cancelled     024 8  $a024$z
Other number cancelled     024 7  $a024$z 024$2
五、特例(XXX描述字段)
本文更多关注特例字段,或许因为这些字段特别需要花精力分析,只是不免显得MARC21似一无是处了。

1、功能而非语义的240字段

对编目员而言,选择240还是130是考试点;机器则无法理解文中后两例(作品集统一题名)。MARC21其实定义了243字段作品集统一题名,可惜实际应用中多采用240字段,用243的极少。
2、冗余字段的存在是为了提供关联,76X-78X连接款目字段就更是如此。
但在MARC21实践中,如773这类字段实际使用不多,这种形式间有差异的情况,对关联记录是负面的。
六、UNIMARC更胜一筹?
比较而言,UNIMARC字段指示符多为缺省值,其1XX代码字段基本一字段一含义,或许比MARC21语义更清晰些。
由于采用嵌套方式(后来增加的子字段可选方式也一样),连接字段形式不一致问题在UNIMARC中应该不存在。