MARC与RDA对照表(对齐与映射)

新RDA已于2020-12-15切换为官方版。在新版工具包中,MARC与RDA对应的信息,分散在各RDA元素的开始部分“元素参考(Element Reference)”。元素参考还包含对都柏林核心术语和IFLA图书馆参考模型的实体关系表述的语义映射,并且计划在适当的时候添加BIBFRAME和UNIMARC映射。

上月有人在RDA-L邮件组中询问,新RDA中有没有与原版“MARC书目到RDA映射”等效的工具。有人回复可以使用“搜索”功能,搜索特定MARC字段或子字段。工具包页面右上的帮助——搜索(Searching RDA Toolkit)给出了例子:”264 *1 $b”(用引号括起,星号表示指示符为空,子字段用美元符号,字段、指示符、子字段之间用空格分开)。这个可以部分解决问题,但不是提问者想要的答案。

官方本月发博文,说明存在RDA元素与MARC21规范和书目格式之间的对齐。不过对照表不在工具包内,而是放在RDA注册(RDA Registry)。实际上新RDA“元素参考”下对应的MARC 21内容,就是由RDA注册中的“RDA元素到MARC 21对齐”生成的。

RDA注册中提供 2种形式下载,分别是RDA元素到MARC21编码的对齐(alignment)和基于对齐的机读映射(map):

  • 对齐(4栏):RDA元素(如abridged as expression),RDA记录方法(4种/结构化-非结构化-标识符-IRI),对齐(aligns with),MARC21书目/规范编码(如500 ** $a)
  • 映射(3栏):RDA元素(如rdaw:P10001),映射(rdakit:hasM21),MARC 21书目/规范编码串与记录方法(如100 0* $0 [identifier])
  • 对齐下载格式为CSV(电子表格),映射下载格式有CSV、N-Triples、Turtle和RDF/XML。

由于是RDA元素到MARC21的电子表格,如果想要MARC字段到RDA元素的对照,只需按MARC21栏重新排序。

对照工作由不列颠图书馆(针对MARC 21书目)和加拿大图书馆与档案馆(针对MARC 21规范)承担。目前基于RDA词表4.0.1版,规范格式有5124行,书目格式有16857行。——一对多的对照,真是够庞大的。

见:RDA and MARC 21 alignments (2020-12-10) https://www.rdatoolkit.org/node/233

UNIMARC书目和规范格式2019年修订

今天给期刊审稿,查自己博客,才发现UNIMARC的2019年修订没有写博文。可能当时看了觉得变化太少,就自觉忽视——只记得新增了与210字段对应的214字段。

看IFLA网页,书目格式的最后更新是2019-8-21,规范格式的最后更新是2019-8-23。不知道新冠肺炎疫情影响,还会不会有2020年更新。无论如何,先补上2019年的。2019年是2008/2009年UNIMARC第3版的第5次更新,也是自2016年以来连续第4年更新。书目格式新增字段1个、更新4个,规范格式新增字段7个、更新近9个,其他还有概述部分更新。

书目格式最重要的新增214字段“生产、出版、发行、制作说明”,其意义可直接引用字段定义:本字段包含与载体表现的出版、生产、发行或制作有关的说明,当编目机构采用的规则指定必须用这些说明时,比如基于RDA条例的规则。也可以说这是专为RDA的新增字段。

因为MARC21针对260字段新增264字段,本以为两者大致相同。今天仔细看,发现UNIMARC还是有所创新,214字段新增2个转录子字段:

  • $r转录自主要信息源的印刷和/或出版信息(NR)
  • $s转录自版权页的印刷和/或出版信息(NR)

虽然说明用于或主要用于较早单行资源(古籍),但其实也适用于新RDA的“载体表现说明”中的生产、出版、发行、制作说明。MARC21已批准采用881字段(MARC DISCUSSION PAPER NO. 2020-DP06),与出版相关的分别用$k、$l、$e、$j表示。显然UNIMARC更合理、好用。

规范格式新增以下字段,与“角色(character)”或者虚构角色有关的新增字段,应该反映的是IFLA-LRM把非真实人物从Agent中排除的重要变化

  • 180代码数据字段:形式、体裁或物理特征(当2XX规范检索点字段中的检索点是形式、体裁或物理特征时,本编码数据字段可用于传达附加信息。)
  • 223规范检索点:角色(本字段包含与作品和内容表达中的虚构角色有关的名称和其他细节的检索点)
  • 370作品附注(本字段用于在规范记录中记录与作品有关的信息,即作品主要内容的特定角色、作品内容的时间顺序或地理范围以及关于作品历史的信息摘要。)
  • 423变异检索点:角色
  • 523相关检索点:角色
  • 723其他语言文字的规范检索点:角色
  • 822其他系统的相应数据(本字段包含有关外部系统中相应数据的信息,旨在实现系统(主题系统、地理数据库,体裁/形式分类等)之间的互操作。)

另外,上月举行的“RDA在欧洲”虚拟会议上,有一个有关UNIMARC与RDA关系的报告《UNIMARC和RDA的融合:更新》(Convergence of UNIMARC and RDA),推荐关注此主题者细看。

会议参见:2020年“RDA在欧洲”虚拟会议:从头开始(2020-10-13)

历次更新参见:

EDTF:扩展日期时间格式

如果在元数据中看到日期为2020-41,会不会感到很晕?是不是弄错了?并没有!这个日期表示的就是当下:2020年下半年。

编目或元数据描述中涉及时间的,通常推荐采用国际标准的日期时间格式ISO 8601,MARC21中常使用美国国会图书馆的扩展日期时间格式(EDTF)。EDTF基于ISO 8601,在2012年发布草案,当前版本发布于2019-2-4。

制定EDTF的背景(EDTF – Background),首先是当时的ISO 8601-2004不足以表达很多应用需要的语义限定与概念,需要加以扩展,例如大致年份(如可能是1984年)。其次是ISO 8601作为国际标准,在很多情况下提供多种格式供选择,实际使用时需要选定、即限制到一个更小的支持集。

ISO 8601-2019基本集成了EDTF扩展的功能,但由于后一原因,现在编目中仍使用EDTF而不是直接使用 8601。换言之,在8601有多个选项时使用EDTF的选项,基本上可以认为现在的EDTF是8601的子集。

Extended Date/Time Format (EDTF) Specification

EDTF采用8601的“扩展格式”(而非“基本格式”)。扩展格式的基本形式是:日期以-分隔,时间以:分隔。(不用分隔符的是基本格式)

日期时间是一个不带空格的字符串。以下概述用到的其他符号、摘取某些数字代码以及常用样例,完整的可查EDTF规范本身。

(一)T 连接日期和时间;Z 世界标准时间(UTC);+或- 比UTC早或晚

1985(年);1985-04(月);1985-04-12(日)。
1985-04-12T23:20:30(本地时间);1985-04-12T23:20:30Z(世界标准时间);1985-04-12T23:20:30+04:30(比UTC早4个半小时)。

(二)表示一年中时间段的数字,除1-12表示月份,21-41分别表示4个季节、4个季度、3个四月期、上下半年。常用的如下:

21-24 春夏秋冬;33-36 第1-4季度;40-41 上下半年
2001-21(2001年春天);2001-34(2001年第2季度)

(三)时间不确定

(1)? 与年连用,~ 与月连用,% 与日连用(符号在数字右边,表示之前整个串不确定;符号在数字左边,表示本段不确定)

1984?(年不确定);2004-06~(年月不确定);2004-06-11%(年月日不确定);
2004-06~-11(年月不确定、日确定);2004?-06-11(年不确定、月日确定);
?2004-06-~11(年日不确定、月确定);2004-%06-11(月不确定、年日确定)。

(2)X 任何年、月、日值的末若干位(不能是单个值的中间位)

201X(2010年代);20XX(21世纪);2004-XX(2004年某月);1985-04-XX(1985年4月某日);1985-XX-XX(1985年某天);
156X-12-25(1560年代某个耶诞日);XXXX-12-XX(某年12月的一天);1XXX-12(11世纪后某个12月);1984-1X(1984年10-12月)

(四)/ 起讫时间;空或.. 时间未知或不确定。起始或结束时间可以用以上(一)(二)(三)表示:

1964/2008(起讫年);2004-02-01/2005(起始日/结束年)
1985-04-12/.. 或 1985-04-12/(结束日期未知或不确定);../1985-04 或 /1985-04(开始月份未知或不确定)
2004-06-~01/2004-06-~20(大约2004年6月1-20日);2004-06-XX/2004-07-03(2004年6月某日到7月3日)