新国际标准号ISNI及ISTC

Catalogablog前几天通报,MARBI新近推出五个建议或讨论稿[1]。一般来说,讨论稿(Discussion Paper)需上升到建议(Proposal),才能最后经过投票正式纳入MARC 21标准。

德国国家图书馆提出建议2010-07“MARC 21书目格式中ISBD标点”,建议在头标第18位增加代码c,表明在MARC记录中不采用ISBD标识符──德奥二国由MAB改用MARC 21,但打算如UNIMARC那样,不采用ISBD标点。这实在是比较符合计算机处理的明智选择

大英图书馆针对新的国际标准号ISNI与ISTC提出了二个建议,分别是:
建议2010-06: 在MARC 21书目与规范格式中记录国际标准名称标识(ISNI)
讨论稿2010-DP04: 在MARC 21书目与规范格式中记录国际标准文本码(ISTC)

ISNI旨在“标识公开身份,即在创建、生产、管理及内容分发链中,整个媒体内容业所公开使用的身份,提供避免公开身份出现歧义的工具。”ISNI可分配给自然人、法人、虚构人物或其组合(http://www.isni.org),用MARC术语,也就是个人、家族、虚构人物、团体或会议。
ISNI目前还是草案标准(Draft ISO 27729),但建议稿中说在3月举行的投票中已全票通过,6月将签署成立ISNI国际机构的协议,大英图书馆及法国国家图书馆将代表欧洲国家图书馆会议CENL作为图书馆界代表,正式注册机构将于2011年4月建立。
很容易联想到规范记录号。想起来FRAD在研制初称为FRANAR,IFLA打算在研究规范记录功能需求的同时,确立一个编号方式。据称更早在1980年代,就提出过ISADN(国际标准规范数据号),而FRANAR工作组最终考虑到以下二个原因而搁置了规范号:1、国际规范控制的重点,已经从给某实体以单一款目形式,转向依用户需求而采用不同形式;2、重点已经从规范记录的物理共享,转向规范活动智力产品的共享。[2]虚拟国际规范档(VIAF)应当是这一变化的实例,而ISNI或许正是符合发展潮流的编号系统,它针对的是一个实体,而不是一个名称形式。
目前的建议是在书目记录的X00/X10/X11(X=1主要款目、6主题检索、7附加款目、丛编附加款目)中以子字段$0(isni)作为标记;主题规范记录则采用字段024 7# $a $2isni。

ISTC是文本作品的标识系统,“文本作品”包括散文、诗歌、歌词,以及银幕、音频、舞台及其他脚本(包括布道、演讲等)。ISTC意在汇聚同一作品的不同载体表现,其意义在了解FRBR后也就不难理解。ISTC于2009年3月成为正式标准(ISO 21047),并已出版用户手册[3]。
早在2003年MARBI就论及过ISTC,本讨论稿提出了在书目和规范记录中采用024字段的几个选项,只在细节上有所不同。

在这两个国际标准号里,都看到FRBR家族的影子。应该不是“人有亡斧者”吧?

[1] Catalogablog: MARBI Papers for Review
http://catalogablog.blogspot.com/2010/05/marbi-papers-for-review.html

[2] Glenn Patton. FRAR: Extending FRBR Concepts to Authority Data. FRBR in 21st Century Catalogues, May 2005. (PPT, sheet no. 8)
http://www.oclc.org/research/activities/past/orprojects/frbr/frbr-workshop/presentations/patton/patton_franar_frbr_workshop_200505.ppt

[3] International Standard Text Code (ISTC) User manual (version 1.2) (PDF, 191 KB).
http://www.istc-international.org/html/multimedia/pdfs/

以一条虚拟记录概览RDA与AACR2之不同

RDA编撰历经五年,到底对AACR2做了哪些改变,做编目的都很关心。然而超大的篇幅,令人不免对RDA望之却步。年初Barbara Tillet做了RDA对AACR2所做改变的演讲[1],点出了变化的精髓。看的过程中把她举的多个例子凑成一条虚拟MARC记录,以此概览RDA与AACR2之不同:

100 $a Brown, Susan.
245 $a Teusday’s tasks / $c by Susan Brown, Melanie Carlson, Stephen Lindell, Kevin Ott, and Janet Wilson ; translated by Tiina Nunnally.
246 $i Corrected title: $a Tuesday’s tasks
250 $a Third revised edition
260 $a Chicago : $b [Publisher not identified], $c 2010.
300 $a 1 online resource (39 pages) : $b illustrations ; $c 26 cm.
336 $a text $2 marccontent
337 $a unmediated $2 marcmedia
338 $a volume $2 marccarrier …
700 $a Nunnally, Tiina, $d 1952- $etranslator

首先,在所有的例子中,字段指标符都没有了。
245$c,第一责任者有4个。RDA摒弃了同一责任方式作者以3为界原则(rule of 3),全部著录。AACR2只著录第一个作者的规定在RDA中为可选。
与之相应,第一责任者人数不影响100的选取。AACR2在此种情况下以题名为主要款目,没有100。
245$a,题名拼写有误的情况下不插入更正或说明,而是在246用$i说明并更正(注:连续出版物不同)。
250采用照录方法,不用特定缩写。(根据国际编目原则声明,RDA 1.7.1规定转录包括大小写、标点、符号、数字、缩写及错误。245依据的是同样原则。也可选择其他方式。不过附录A对大小写、附录B对缩写仍有规定)
同样,300也不再使用特定的缩写,如p.改用pages,ill.改用illustrations。各行业通用缩写cm仍然保持不变。
出版信息不明时,摒弃拉丁缩写词S.l.及S.n.,260采用直白的说明语,仍加方括号表明非取自出版物:[Publisher not identified]。(其他拉丁文缩写如ca., i.e., et al.均不用)
700$e,100/700的关系词$e并非新定义,但在目前的MARC记录中都是被忽略的,只在旧记录中有。现在又捡回来了,目的就是要揭示责任者与资源间的具体关系。(用词见RDA附录I)
336-338为新增,由原位于245$h的一般资料标识(GMD)扩展而成。原来普通文本不用,但在RDA中,336内容类型与338载体类型是核心元素(即必备项),337媒体类型为可选。$a用词取自$2所指词汇表。[update 2010-05-07: 见LC标准网站的 Value Lists for Codes and Controlled Vocabularies]

根据LC的RDA测试培训资料[2],还有一些变化:
头标18=i原来头标第18位=a,代表AACR。LC决定继续采用ISBD标识符,故用i;不知道像德国那样不用ISBD标识符的,如改用RDA,头标第18位用什么)
用040$e rda,说明以RDA为编目规则

感觉上,RDA少了特例(如超过三个以上作者的规定),少了特定的缩写词(250、260、300),方便了编目入门。336-338基本上可以用编目模板搞定。然而,要用RDA进行编目,还有很多繁琐的规定,仍然不是那么容易掌握的。
另外,RDA采用FRBR术语(如作品、内容表达、载体表现、单件),同时改变了不少AACR2的词汇,但编目的基本方式并未改变。可能少了某些“行话”,改用了另一些“行话”,比如“标目”变为“规范检索点”,“主要款目”变成“首选题名”或“创建者规范检索点”,“统一题名”变成“首选题名”,“参见”变为“变异检索点”,“主要信息源”改为“首选信息源”……。另外“必备”改为“核心”。

刚看到 Christine Schwartz 介绍 Adam Schiff 很强大的报告[3],100页PPT,以MARC格式对照AACR2与RDA的不同,适合细细品读。E-LIS上的pdf竟然无法访问,幸亏有RDA-JSC网站上的PPT原件

参见:
[1] Barbara B. Tillett. RDA: Changes from AACR2 for Texts. LC Digital Futures and You, Jan. 12, 2010
http://www.loc.gov/today/cyberlc/feature_wdesc.php?rec=4863
[2] LC的RDA测试培训资料上网 (2010-04-22)
http://catwizard.net/posts/20100422220045.html
[3] Cataloging Futures: Changes from AACR2 to RDA: a comparison of examples / by Christine Schwartz. April 28, 2010
http://www.catalogingfutures.com/catalogingfutures/2010/04/changes-from-aacr2-to-rda-a-comparison-of-examples.html

ISO 3166和LC国家代码表

整理书目数据库的时候,发现有不少记录出版国为塞内加尔(代码sg),显然是不可能的,便问编目部同事原因,回答sg是新加坡,塞内加尔是sn,于是把系统代码表中sg的说明改了,又增加了代码sn。接下来处理没有语种的记录,发现MARC21记录中新加坡用的是si,大呼上当。把系统代码表改回,再去“质问”同事,为何误导我?同事说查过CNMARC手册,没错,并进一步说明依据的是ISO 3166。
难道LC的国家代码与ISO标准不同?网上查到ISO 3166国家代码(country code) ,和LC的国家代码表(MARC Code List for Countries) 对照,还真是不同。或者说,UNIMARC和MARC21所用国家代码表是不一样的。
想起来以前就知道,CNMARC中国家代码中国是cn,而MARC21是cc,cn是加拿大的代码。因为加拿大基本上用带省的3位码,所以一般不会冲突,在本馆系统代码中早就把cn改成了中国,因此系统中cc和cn都是中国。但实际上还是会有不确定出版地的加拿大出版物用cn的。
没有逐一对比ISO 3166和MARC21的国家代码表,不知道还有多少是冲突的。本馆系统二种MARC格式的记录导入系统后放在同一个库中,并且语种、国家等代码单独抽出用于限定检索,同一国家有二个代码已经成问题,同一个代码还有不同含义,更令人头痛。
联想到如果用现在很热的关联数据,给每个值都加上URI,那么MARC21国家代码表的cc有一个URI,ISO 3166的cn也有一个URI。做到这一步还没什么用,还要有机制把这两个URI关联起来,说明都是代表的中国,并关联到某个地理信息系统,有关中国的各种信息应有尽有……
扯远了。附ISO 3166 Codes (Countries)的HTML版,可保存到本地备查。