MARC21书目的元素集及值词表的注册

继给RDA的元素与词表注册以后,开放元数据注册(OMG)又给MARC21书目格式做了元素集及值词表注册。与RDA注册先提出、后出版(并且至今还没有全部完成)不同,这次MARC21书目的注册在9.11当天一次性直接发布。
开放元数据注册(Open Metadata Registry, OMG)受美国国家科学基金(NSF)三年资助,曾称NSDL Registry。现资助期结束,服务由元数据管理协会(Metadata Management Associates, MMA)管理,承诺将其作为一个开放系统来维护注册服务,其主要负责人为Diane Hillmann,也就是RDA注册的主导者。

此次发布的版本被称为采用RDF的MARC21元素和词表的MMA版(The MMA version of MARC 21 elements and vocabularies in RDF),是MARC21书目格式的关联数据版。据称是为了顺应图书馆界走出MARC的需要──用MARC抛弃MARC,有点讽刺?
Diane说这个版本与LC(MARC21标准维护机构)无关,但顺应了LC的书目框架转换行动(Bibliographic Framework Transition Initiative)。
此版本所用URI是http://marc21rdf.info/。这不禁令人想起2008年LC员工Ed Summers注册的lcsh.info,用SKOS将LCSH发布为语义网应用,不久即被LC叫停。2009年LC自己以SKOS将LCSH(及其他关联数据应用)发布于id.loc.gov。这个MMA版的MARC21会是同样结局吗?
再联想到OMG与RDA官方间不太和谐的关系,其RDA注册的命运又将如何?
会不会先驱变先烈?悲观了。

MARC21的注册包括14个元素集与115个词表:
MARC21 Element Sets
根据MARC字段特性组成14个元素集:
00X, 0XX-5XX(6个), 60X(个人主题), 61X(团体、会议主题), 63X(统一题名主题), 64X(时间主题), 65X, 7XX, 8XX
主题分得这么细,却没有把76X-78X(链接款目)从7XX中分出来,有点出乎意料。
元素集中最少有80个元素(64X)、最多有2000个元素(63X),合计10740个元素。这些元素并不与子字段等同,而是组合了2个字段指示符、子字段等(未及细看),如63X只有630一个字段、25个子字段,却有2000个元素(第1指示符为0-9不排序字符,第2指示符为0-7不同主题词表)。另外00X也是没有子字段的,其367个元素当根据字符位等区分。
MARC21 Vocabularies
115个词表包括:定长字段006(1个)、007(94个)、008(20个)中各字符位的取值。
006是008的补充,除第1位(15种资料类型)外,其他定义均同008/18-34字符位,故只有1个表。内容值合计1262个。

Via Metadata Matters: ELEMENTS OF MARC21 BIBLIOGRAPHIC STANDARD REPRESENTED IN RESOURCE DESCRIPTION FRAMEWORK BY METADATA MANAGEMENT ASSOCIATES / By Diane Hillmann, September 12, 2011

参见:
关联数据:官方版与山寨版(DDC和LCSH)(2009年8月21日)
准备抛弃MARC?美国国会图书馆启动“书目框架转变行动”(2011年5月24日)

RDA近期走向(2011.8)

RDA主管机构负责人委员会(COP)于8月初举行会议,确认未来一段时间内RDA的走向。会议主要成果如下:

1、文字编辑(copy editor)
[针对美国测试协调委员会报告建议重写RDA用法说明的要求],确定一系列与雇佣文字编辑有关的事务。并将与正在翻译RDA的机构协调;在2012年6月前至少有五章完成并被认可。

2、JSC组成与更新过程
[RDA由美、英、加、澳四国编制,为将RDA扩大到英语世界以外],确定将在未来二三年内增加1-3名[其他国家的]代表。
JSC将是一个常设机构,联机协作,每年开会一次。RDA的大更新至少每年二次,小更新至少每月一次,在工具套件中将有标记注明。

4、参与
支持出版社开发工具套件用户组、开发博客,以强化社区参与;
支持持续参与其他开放与关联数据社区。

5、实施
英国图书馆、加拿大图书馆档案馆、美国国会图书馆及澳大利亚国家图书馆确认其2007年10月22日协调实施RDA的协议,时间不早于2013年初。

———-质疑的分割线———-
对于会议成果,Bernhard Eversberg在RDA-L邮件组中表达了强烈的质疑,认为RDA开发与现实脱节。除了好奇文字编辑会给RDA文本带来些什么外,他认为最令人感兴趣的部分在会议成果报告中没有触及:

1、开放获取
从出版社继续资助RDA相关工作看,RDA产品(即工具套件)营销的商业模式不会改变,即在可见的未来,RDA文本不开放获取。但如果仍然希望“其他社区”加入的话,这是一个关键点,他们不会花钱访问一个全球垄断的文本。

2、MARC
未涉及MARC。测试报告把由MARC迁移作为RDA实施的重要条件[略有误解?]。规则与格式的开发应该比以往协调得更好,现在正是JSC的大好机会,至少就此发表声明并制订一些前瞻性的指导。

3、实施方案
没有触及[编制过程中设计的3种]实施方案(scenarios)。测试数据备受批评,因为对RDA的解释过于胆小,未能超过方案3[最基本方案,书目与规范数据不关联]。

———-链接的分割线———-
Outcomes of the Meeting of the RDA Committee of Principals, 24 August 2011

Re: [RDA-L] Presentations added to the JSC website (2011.9.5) / Bernhard Eversberg(梯子自备)

RDA可能的修改及时间表 (2011年6月22日)

RDA的内容、媒介与载体类型

梳理了前RDA时代的各种文献类型区分,作为理解RDA设置多种资源类型的基础,有些部分变化还是很大的。
RDA的三种资源类型──内容类型、媒介类型和载体类型。从RDA正文内容可知,媒介类型可视为载体类型的上位,与载体类型一样,对应于载体表现(Manifestation),而内容类型对应于内容表达(Expression)。未来这三种类型当在数据的聚类与FRBR展示方面发挥作用。

———-内容类型(Content Types)———-
通过与前RDA时代编目中各种文献分类的对照,发现RDA的内容类型有些细化(声音、口语),有些增加(舞谱),有些合并(电影、录像),有些扩充(二维、三维移动图片)。相对而言,内容类型的划分比媒介类型和载体类型更主观些。
内容类型现有25种,可大致归入MARC21头标06位“记录类型”(14种),细化了舆图、计算机及触觉资源,而完全没有“手稿”类型。
内容类型对应MARC字段336|a,而|b的3位代码并不与头标06对应,基本上前2位表示主要类型,1位表示次要类型:

1-6 舆图 cartographic … (cr) (06=e舆图,f舆图手稿)
… dataset 数据集 (d)
… image 图片 (i)
… moving image 移动图片 (m)
… tactile image 触觉图片 (t)
… tactile three-dimensional form 触觉三维品 (n)
… three-dimensional form 三维品 (f)

7-8 计算机 computer … (co) (06=m计算机文档)
… dataset 数据集 (d)
… program 程序 (p)

9 舞谱 notated movement (nt v) (06=a语言资料,t语言资料手稿)
10 乐谱 notated music (nt m) (06=c乐谱,d乐谱手稿)
11 表演音乐 performed music (prm) (06=j音乐录音)
12 声音 sounds (snd) (06=i非音乐录音)
13 口语 spoken word (spw) (06=i)
14 图片 still image (sti) (06=k二维非投影图片)

15-19 触觉 tactile … (tc) (06=k; c,d; a,t; r三维人工制品或天然物品)
… image 图片 (i)
… notated music 乐谱 (m)
… notated movement 舞谱 (n)
… text 文本 (t)
… three-dimensional form 三维形式 (f)

20 文本 text (txt) (06=a,t)
21 三维品 three-dimensional form (td f) (06=r)
22 三维移动图片 three-dimensional moving image (td m) (06=g投影介质)
23 二维移动图片 two-dimensional moving image (td i) (06=g)
24 其他 other (xxx) (06=o套件,p混合资料)
25 未指明 unspecified (zzz)

参见:
Term and Code List for RDA Content Types
MARC 21 Format for Bibliographic Data: 336 – Content Type
MARC 21 Format for Bibliographic Data: Leader

———-媒介类型(Media Types)———-
媒介类型指通过观看、播放、运行等方式使用资源内容时需借助设备的类型,是一个比较宽泛的类型。
媒介类型是RDA三种类型中唯一的非核心元素,是载体类型之上位概念。
根据其与MARC21字段007资料类别的对应关系,可以大致了解以往熟知的文献类型,在采用RDA后属于什么类型。

媒介类型对应MARC字段337|a,共10种;|b的1位字母代码与007/00基本对应。
1音频 audio (s=sound recording)
2计算机 computer (c=electronic resource)
3缩微 microform (h=microform)
4显微(新增) microscopic (p)
5投影图像 projected image (g=projected graphic;007另有m: motion picture)
6立体(新增) stereographic (e)
7无中介 unmediated (n,007为t: text, k: non-projected graphic)
8视频 video (v=videorecording)
9其他 other (x;007无,对应z:unspecified)
10未指明 unspecified (z=unspecified)

RDA的媒介类型10种(减去2种未指定格式,实际为8种),其中“显微”与“立体”还是新增的,远少于007/00的15种资料类别(category of material)。007/00中大部分以上未列出的资料类别,一般情况下多可归为“无中介”载体类型:
地图 map a -> 无中介n
球仪 globe d -> 无中介n
触觉资料 tactile material f -> 无中介n
非投影图像 nonprojected graphic k -> 无中介n
电影 motion picture m -> 投影图像g
套件kit o -> 依其中内容重复
乐谱 notated music q -> 无中介n
遥感图片 remote-sensing image r -> 无中介n
文本 text t -> 无中介n

参见:
Term and Code List for RDA Media Types
MARC 21 Format for Bibliographic Data: 337 – Media Type
MARC 21 Format for Bibliographic Data: 007 – Physical Description Fixed Field-General Information

———-载体类型(Carrier Types)———-
载体类型反映存储介质的格式与载体的外形,在RDA中是与媒体类型结合的一种分类形式。载体类型决定了实际用来观看、播放、运行等的设备,如视频载体中的录像带由录像机播放,视盘由光盘机播放。
如果说媒介类型相当于ISBD的GMD(一般资料标识)的话,载体类型则相当于ISBD的SMD(特殊资料标识),虽然RDA与ISBD二者所用术语/词汇有相当大的差别。根据所属分类,由载体类型即可推出媒介类型,因而非核心(非必备)的媒介类型可以在任何时候由核心元素载体类型自动生成。

载体类型对应MARC字段338|a,分为9类(同媒介类型,除“其他”),每类下细分到具体的载体类型。|b的2位字母代码与007/00-01基本对应,00同媒介类型|b,01为“特殊资料标识”(Specific material designation, SMD)。

1音频载体 audio carriers(8种)
2计算机 computer carriers(9种)
3缩微 microform carriers(10种)
4显微 microscopic carriers(2种)
5投影图像 projected image carriers(10种)
6立体 stereographic carriers(3种)
7无中介 unmediated carriers(7种)
— card 卡片
— flipchart 挂图
— roll 卷轴
— sheet 单张
— volume 卷册
— object 实物
— other unmediated carrier 其他
8视频 video carriers(5种)
9未指明 unspecified carriers(1种)

参见:
Term and Code List for RDA Carrier Types
ARC 21 Format for Bibliographic Data: 338 – Carrier Type

P.S. 按MARC21标准说明,336-338的|a|b可重复,只有采用不同来源词汇时才重复本字段。
NCSU规定只采用RDA词汇,不重复子字段,而是重复字段──对于单一系统当有助于数据规范化及后期处理。而MARC21标准的规定则有较广的适应面,也方便使用多种词汇表的系统的数据处理。两种用法可谓各有千秋。