日志标签 ‘若有所思’

RDA最要记住的12件事(TOP 12)

2011年8月7日

RDA声称其基础有二,一是FRBR/FRAD,一是ICP。RDA在结构上基于FR模型,FR的影响显而易见。相较而言,ICP的影响就不那么明显直接。这几天正在想这个问题,看6月1日Judith A. Kuhagen在NASIG(北美连续出版物兴趣组)会前会上的“最要记住的12件事”,略有所得(5月30日到6月1日Barbara B. Tillett在意大利佛罗伦萨大学“RDA研讨会”、5月4日两人在马里兰图书馆协会会前会“RDA来了、你准备好了吗”上有相同内容)。见:Presentations on RDA (2011)

“Top Twelve” things to remember [ppt]

#1 用户需求/用户任务:查找、识别、选择、获取
说明:源自ICP(国际编目原则声明)总原则一“用户的便利性”(在对著录以及用以检索的名称的受控形式作出抉择时应该考虑到用户)。需要编目员判断,在核心元素之外,是否还需要其他数据以满足用户任务。

#2 “用所见形式”(表达性原则)
说明:ICP总原则三(著录以及名称的受控形式应按实体描述其本身的方式来确定)。

#3 基于元素的描述:方便重用元数据、元素集及控制词汇的注册、更多采用已有数据(如ONIX)
说明:当指不是基于“记录”

#4 作品、内容表达、载体表现、单件(WEMI)
说明:FRBR第一组实体,所描述资源的方面

#5 “核心”与“如果……核心”元素:可增加(与#1相关)

#6 替代、可选省略、可选增加(与#1相关)
说明:由各单位自己选择决定。未来数月将分析LC为RDA测试所作的初步决定以决定未来的实践[LCPS吧]。

#7 更少缩写(与#1和#2有关)
说明:更方便用户理解

#8 关系、关系、关系(多超出核心元素)
说明:指明关系以在书目系统中更好导航[ICP目录功能,在4个FRBR用户任务上增加:查找、识别、选择、获取及导航。RDA未采用“导航”。]

#9 内容、媒介、载体类型
说明:取代GMD(一般资料标识)。希望未来的系统能够用于显示相应图标、作为其他可视显示的依据,过滤或限定检索,对资源分组。

#10 取消“3的规则”──由编目员判断
说明:“3的规则”成为替代做法

#11 信息源扩大
说明:一般而言,任何来源均可用于识别数据。对某些元素,给出优先顺序的信息源

#12 识别特征(元素及关系)作为未来系统的基础:与厂商讨论新系统需求
说明:留待系统开发商使用RDA元素集与控制词表的结构与关系,为用户及方便编目员而建立更复杂的系统。

“MARC21作为数据初步”读后感

2011年8月6日
MARC21 as a Data: A Start / By Karen Coyle. Code4Lib Journal, Issue 14, 2011-07-25. ISSN 1940-5758
一、子字段关系类型
以前看远洋师解说词汇间关系,老觉得自己脑子不够用。本文“Finding Patterns”部分对MARC21的子字段与同一字段其他子字段及资源(当指字段)关系的明确划分,也是需要类似的清晰头脑才能分析出来的。

Figure 1.Types of Relationships Between MARC Subfields

二、控制字段00X
从计算机处理角度,控制字段(主要是006、007、008定长字段)虽显复杂但含义明确,可以直接使用“00X+文献类型+位置”生成标识,如:
007microform05 表示缩微品的压缩比
008map22-23 表示地图的投影
推理:再配以取值词汇表,可以很方便地变成“数据”。
三、字段指示符
MARC21的字段指示符使用非常广泛,这使得同一字段可表达更多的不同含义。0XX数字与代码字段从定义上只能容纳不足100种含义,但由于字段指示符的使用而有很大的扩展余地(如024第1指示符=7标准号类型在$2说明,使包含的标准号类型可任意扩充)。但如此增加了将MARC21记录处理为“数据”的复杂性。
字段指示符还有完全不同的用法:“是或否”──当指050第2指示符LC馆藏;单个值或多个值,如034第1指示符比例尺是单个还是范围,这个被指完全没有必要。
四、被取消的标准号(024字段)
文中对于024中其他子字段与$a依存关系的认识或有不足:
$c获得条件与标准号的依存,是因为在同一条记录中,会有多个号码,不同号码有各自的获得方式(如标价)──即使不同载体如纸本与电子版做多条记录仍是如此,最常见的有精平装、不同卷册,除非一号一记录。由于美国出版物上标价的不多,所以现有记录中少见$c,或许因之Karen不明如此设计的理由?
$z取消号的情况同样如此。所以文中表格的下面部分或许应当更改:
ISRC Cancelled     024 0  $a024$z
UPC Cancelled     024 1  $a024$z
ISMN Cancelled     024 2  $a024$z
EAN Cancelled     024 3  $a024$z
SICI Cancelled     024 4  $a024$z
UNKnown Number Cancelled     024 8  $a024$z
Other number cancelled     024 7  $a024$z 024$2
五、特例(XXX描述字段)
本文更多关注特例字段,或许因为这些字段特别需要花精力分析,只是不免显得MARC21似一无是处了。

1、功能而非语义的240字段

对编目员而言,选择240还是130是考试点;机器则无法理解文中后两例(作品集统一题名)。MARC21其实定义了243字段作品集统一题名,可惜实际应用中多采用240字段,用243的极少。
2、冗余字段的存在是为了提供关联,76X-78X连接款目字段就更是如此。
但在MARC21实践中,如773这类字段实际使用不多,这种形式间有差异的情况,对关联记录是负面的。
六、UNIMARC更胜一筹?
比较而言,UNIMARC字段指示符多为缺省值,其1XX代码字段基本一字段一含义,或许比MARC21语义更清晰些。
由于采用嵌套方式(后来增加的子字段可选方式也一样),连接字段形式不一致问题在UNIMARC中应该不存在。

RDA注册第一批词汇表出版

2011年8月2日

RDA在编制过程中,于2007年与DCMI协作成立的DCMI/RDA工作组,开始与语义网/关联数据相关的工作,其最主要成果就是发布在开放元数据注册(Open Metadata Registry)的RDA词汇表(The RDA (Resource Description and Access) Vocabularies)。在RDA最终发布的联机产品“RDA工具包”(RDA Toolkit)中,该注册的链接列于“其他资源”。

词汇表注册工作约始于2008年,内容包括RDA元素集(RDA Element Sets)和RDA词汇表。在2011年6月RDA美国测试协调委员会报告与建议中,对RDA编制方JSC提出的建议之一是6个月内完成对RDA元素集与词汇表的联机注册。时隔月余,2011年8月1日,JSC、DCMI/RDA工作组及出版方ALA出版社宣布,首批RDA控制词汇表经过评审获得批准,其状态已由“新提出”改为“出版(published)”。

词汇表包括描述(著录)中非照录部分的规定用语,大多在RDA中列出或说明过。目前注册的词汇表共有68个,本次出版的为11个:
RDA Aspect Ratio (http://RDVocab.info/termLIst/AspectRatio)
RDA Form of Musical Notation (http://RDVocab.info/termList/MusNotation)
RDA Form of Notated Music (http://RDVocab.info/termList/FormatNoteMus)
RDA Layout of Cartographic Images (http://RDVocab.info/termList/layoutCartoImage)
RDA Mode of Issuance (http://RDVocab.info/termLIst/ModeIssue)
RDA Other Distinguishing Characteristic of the Expression of a Legal Work
(http://RDVocab.info/termList/OtherCharExpLegal)
RDA Production Method for Tactile Resource
(http://RDVocab.info/termList/prodTactile)
RDA Reduction Ratio (http://RDVocab.info/termLIst/RDAReductionRatio)
RDA Scale (http://RDVocab.info/termList/scale)
RDA Sound Content (http://RDVocab.info/termList/soundCont)
RDA Status of Identification (http://RDVocab.info/termList/statIdentification)

注册词汇表中每一个取值(Concepts)都有URI,可以作为关联数据直接引用。

Keven说“可以以此为基础进行有关编目规则本地化设计……”。在“RDA中文化研究”设想中,确定在词汇表正式出版后选择部分常用的做翻译。记得以前在词汇表注册中看到过德语词汇,如果有可能,也应该注册对应的汉语词汇。

———-出处的分割线———-
First RDA Vocabularies Published (1 August 2011)

(书社会)Keven的日志:RDA术语表正式发布 (2011-8-2)

RDA图书一览

2011年7月30日

RDA: Resource Description and Access / by Resource Description & Access and RDA (Nov 22, 2010)

即RDA的活页印刷版。

以下依时间为序:

RDA Vocabularies for a Twenty-First-Century Data Environment / by Karen Coyle (Mar 1, 2010)
从关联数据角度讨论RDA。刊于期刊:Library Technology Reports, v.46, no.2(ProQuest、EBSCO收录)
1 Library Data in the Web World 5
2 Metadata Models of the World Wide Web 12
3 FRBR, the Domain Model 20
4 RDA in RDF 26
Resources 37

Introducing RDA: A Guide to the Basics / by Chris Oliver (Jul 9, 2010)
最早的RDA入门性专著,亚马逊Look Inside可以看第一章及文后部分。推荐阅读书目较全面。
1 What is RDA? 1
2 RDA and the International Context 6
3 FRBR and FRAD in RDA 13
4 Continuity with AACR2 37
5 Where Do We See Changes 47
6 Implementing RDA 73
7 Advantages, Present and Future 91
Selected Resources and Readings 105
Index 111

The RDA Primer: A Guide for the Occasional Cataloger / by Amy Hart (Sep 16, 2010)
对RDA及相关内容的简要解说,亚马逊Look Inside可以看导论、第一章前面部分及索引。
Introduction xi
1 History and Development of RDA 1
2 What is FRBR? Who is FRAD? 9
3 FRBR and FRAD Entities 13
4 FRBR and FRAD Relationships 21
5 AACR2 to RDA 29
6 Changes from AACR2 to RDA 35
7 MARC Changes 45
8 Putting It All Together 53
9 RDA and Library Systems 61
10 Metadata Community 65
11 RDA and Metadata 71
12 RDA and YOU 79
Work Cited 83
Index 87

Describing Electronic, Digital, and Other Media Using AACR and RDA: A How-To-Do-It Manual for Librarians / by Mary Beth Weber and Fay Austin (Nov 30, 2010)
估计就提到一点儿RDA。书评:”This is an up-to-date and handy desk reference for catalogers of electronic, digital cartographic, sound, video, Internet, database, and other mixed media. It’s also suitable for non-tech services librariansa€|With a useful CD-ROM for step-by-step help and a companion website that will be updated as necessary. Recommended.” –Library Journal, April 2011

Practical Cataloguing: AACR, RDA and MARC21 / by Anne Welsh and Sue Batley (Jun 30, 2011)
最新RDA教科书,主要章节:
introduction to catalogs and cataloging standards;
publication formats and bibliographic elements;
access points and headings;
RDA: the new standard, its development, structure and features;
AACR and RDA: the similarities and differences between the two standards;
the MARC21 record, studying tags, indicators and sub-field codes;
summary, outlining the major issues.

自动生成RDA格式记录

2011年7月30日

朋友告诉我,那个由亚马逊数据直接获取MARC记录的工具现在提供RDA格式了,在页面查询ISBN时勾选RDA Format即可:
http://chopac.org/cgi-bin/tools/az2marc.pl

需要说明的是,RDA是一个元数据内容标准,非并格式标准。这里所谓的“RDA格式”记录,指的是采用RDA而非AACR2作为编目规则的MARC格式记录。

作为一个MARC记录自动生成工具,目前它对RDA的处理还是过于简单化的,以ISBN 9780812980530为例,大致上情况是:
1、040说明是依据RDA编制的记录
040 |e rda

2、有为RDA增加的MARC字段336-338
336 text |b txt |2 rdacontent.
337 unmediated |b n |2 rdamedia.
338 volume |b nc |2 rdacarrier.

3、其他字段没有按照RDA修改依据AACR2的著录(与不勾选“RDA Format”时相同)。引记录比较明显的有两点:
260,出版地不详,没有用RDA要求的“Place of publication not identified”,而是用AACR2规定的拉丁语缩写“[S.l.]”
300,页码,没有用RDA要求的全拼“pages”,而是用AACR2的缩写“p.”。
[update 2011-8-7]补充:还有头标第18位,仍为a而非i──此点与040|erda一起,共同构成RDA记录的标志。
———-分割线——
由亚马逊数据直接获取MARC记录 (2006年8月22日)
由亚马逊及IMDB数据获取MARC记录 (2011年3月26日)