MARC/RDA工作组最终报告(与新RDA相关的MARC21更新)

2022年12月初,《MARC/RDA工作组最终报告》(2019-2022)发布,汇总了与新RDA相关的MARC21更新:

MARC/RDA工作组最终报告(MARC/RDA Working Group: Final Report / Thurstan Young,MARC咨询委员会英国代表)

【目次】

1 导言(概述;背景;职责、成员与工作计划;指导原则)

2 MRWG修改建议(主要涉及新概念相关元素:载体表现说明、扩展计划、发行方式、装订类型、比例尺、代表性内容表达、数据出处)

3 未决问题(主要是因LRM而新增或内涵扩大的实体:RDA实体、 行为者、集体行为者、命名、时间段、地点,特定概念问题;没有新增或修改,或因未得到MAC批准,或有待RDA本身进一步开发)

4 结论(MRWG的讨论稿和修改建议主要集中于RDA官方工具包引入的新概念及其相关元素和词表编码方案;未包括2022年3月实施的收藏模型(Collections Model),参见:RSC在RDA中实施收藏模型的决定(2021-12-14)/posts/2021/1214/5788

5 附录(成员及所属单位)

(导言)本报告描述MARC/RDA工作组(MRWG)在2019年至2022年【2019/12-2022/1】活动期间的目的、业务和成果。它阐述工作组成立的背景、职责、成员、工作时间表和指导原则,详细介绍MRWG为响应RDA工具包重组和重新设计项目(3R)的结果而提出的MARC 21变更。在更广泛的背景下,报告还详细说明了MRWG考虑过但最终出于各种原因选择不进行的变化。总之,它对MARC 21中实施3R的局限性以及未来进一步发展的范围进行了全面分析。

(背景)新RDA工具包2018年6月发布,2020年12月正式取代原RDA工具包。官方RDA工具包包括实施《IFLA图书馆参考模型》(LRM)所需的新实体和元素。作为负责维护原始RDA工具包中MARC 21书目格式映射的机构,大英图书馆进行了差距分析,以确定MARC 21格式中未涵盖的官方RDA工具包的最重要方面。然后,它联系RDA理事会,建议RDA指导委员会(RSC)与美国国会图书馆的网络开发和MARC标准办公室(NDMSO)联系,重新召集RDA/MRC工作组。该小组于2008年首次成立,目的是在原RDA工具包发布后,就MARC 21格式的更改提出建议。2019年12月,NDMSO应RDA理事会要求成立MARC/RDA工作组。

(指导原则)……MRWG基于以下理由拒绝了MARC 21的一些预期变更:目前用例不足;MARC 21不兼容;RDA的持续发展。

以下为第2节MRWG修改建议的摘录,加上了相关链接。说明:原文“内容标识”(content designation)指MARC字段/子字段;取值词表有的用LC代码表(lc…),有的用RDA取值词表(rda…)。

2.1.1 载体表现说明(Manifestation Statements):字段881–载体表现说明(书目)

允许使用扫描数据对整个或部分题名页内容等进行编码,也允许准确转录早期印刷资源载体表现上的说明(如复杂的出版/发行和制造说明)。

示例2:881 ##$cTHE Opening of Heauen gates, Or The ready way to euer-lasting life. Deliuered in a most Familier Dia-logue, betweene Reason and Religion, touching Prædestination, Gods word, and Mans Free-will, to the vnderstan-ding of the vveakest Capacitie, and the confirming of the more strong.\\$dThe second edition.\\$cBy ARTHVR DENT, Preacher of the word of GOD, at South-shoobery in Essex.\\$fImprinted at London for Iohn Wright,\\$gand are to bee sold at his shop at Christ-Church gate.\\$f1611.

2.1.2 扩展计划(Extension Plan):字段335–扩展计划(规范/书目)

用于“历时作品”(如连载、多部分和整合资源),使用受控词表rdaep【RDA取值词表/扩展计划

示例1:335 ##$astatic plan$2rdaep

2.1.3 发行方式(Mode of Issuance):字段334-发行方式(书目)

官方RDA工具包明确区分“发行方式“和新的“扩展计划”元素,重新定义“发行方式”仅描述资源是否由一个或多个单元组成,而“扩展计划”则描述资源如何随时间发展。使用受控词表rdami【RDA取值词表/发行方式

示例1:334 ##$asingle unit$2rdami 单单元

2.1.4 装订类型(Type of Binding)字段340–物理介质/子字段$1-装订(书目)

原在字段020$q、563-装订信息,记录非结构化值。现使用受控词表rdatb【RDA取值词表/装订类型

示例2:

340 ##$3teacher edition$lcase binding$2rdatb

340 ##$3coursebook$lperfect binding$2rdatb

340 ##$3workbook$lspiral binding$2rdatb

2.1.5 比例尺(Scale)。字段507–视觉资料比例附注(书目)

原限“图像资料”,重赋标签、扩大范围。

示例1:507 ## $a Scale 40 feet to 1 inch.

2.1.6 代表性内容表达(Representative Expressions)。字段387–代表性内容表达特征(规范/书目);音乐:字段382–表演媒介/第1指示符=2/3(规范/书目),字段384–调/第1指示符=2(规范/书目)

LRM概念,代表性内容表达指“被认为是标识作品的典型数据源的内容表达”。

示例1:387 ##$f034600【$f持续时间3h46m】

示例2:382 2#$apiano$n1$aflute$n1$acello$n1$s3$2lcmpt【$a表演媒介$n同一媒介表演者数量;使用受控词表lcmpt=LC音乐表演媒介叙词表 Medium of Performance Thesaurus for Music】https://id.loc.gov/authorities/performanceMediums.html

2.1.7数据出处(Data Provenance)

创建子字段+类别+关系,以明确和细粒度的方式记录。【3.1.7特定概念问题,特别说明只有选择地使用;取值仅使用MARC21代码(见下),不使用官方RDA工具包全部类别(未找到RDA数据出处代码)】

(规范)附录H–数据出处子字段子字段$7(除以下字段),856$e

(书目)附录J–数据出处子字段子字段$7(除以下字段),856$e,76-78X$1,533/800-830$y

示例1:245 10$aAsʾila ḥaula ‘l-marʾa wa-‘l-masǧid$bfī ḍauʾ nuṣūṣ aš-šarīʿa wa-maq ṣidih$cd. sir ʿAuda$7(dpesc)DIN 31635:2011【$7:dpesc=参考来源,DIN 31635:2011=音译标准】

示例2:700 1#$0(DE-588)103331727$aMichajlova,Natalʹja I.$4aut$7(dpes/dpsfa)Latn【$7:dpes=数据出处-文字,dpsfa=数据出处-关联子字段$a,latn?】

MARC记录中使用ISO 639-3语言代码指南(PCC)

合作编目计划(PCC)日前发布《MARC记录中使用ISO 639-3语言代码指南》。

目前MARC(包括CNMARC)所用语言代码为ISO 639-2,ISO 639-3是在其基础上扩展的,含近8千个语言代码(也是3字母)。

PCC提出在书目和规范记录中使用ISO 639-3进行编码,目的是为用户提供更准确精细的语言信息,特别是对于土著语言、手语、历史语言和人工语言,以及更好地识别某些语言(如汉语和阿拉伯语)的视听资料记录中的口语或歌唱语言。

需要说明的是, ISO 639-2实际上由两个标准组成:ISO 639-2/B(书目,MARC所用语言代码)和ISO 639-2/T(术语)。两者涵盖相同的语言,但在某些情况下代码不同,而ISO 639-3使用ISO 639-2/T代码。

指南规定继续使用MARC语言代码进行编目(书目记录008/35-37及041字段),只在找不到具体代码的情况下,选用附加的041字段记录ISO 639-3语言代码。无论代码是否相同,只要使用ISO 639-3代码没有增加有关资源语言的附加信息,就无需使用ISO 639-3代码创建041字段。如果有多种语言,找不到MARC语言代码但有ISO 639-3代码,则只做ISO 639-3编码的041字段。

未来可能会开发宏或其他自动化手段,由ISO 639-3语言编码生成ISO 639-2语言代码字段,从而避免重复编码。

指南规定,对于ISO 639-3中认为的宏语言(语言家族),应尽可能使用最具体的代码。以汉语为例,其标准书面语使用代码cmn(普通话/国语),不用对应MARC代码chi的宏语言代码zho(汉语)。示例5.4. 粤语影音资料:

008/35-37 (Lang): chi
041 1# $a chi $j chi $j eng $h chi(中文对话,中英双语字幕,译自中文)
041 17 $a yue $a cmn $j cmn $j eng $h yue $2 iso639-3(粤语、普通话对话,普通话、英语字幕,译自粤语)
245 00 $a 少林足球 = $b Shaolin soccer / $c 寰宇娛樂有限公司 ; 星輝海外有限公司 ; 編劇周星馳, 曾 謹昌 ; 監製楊國輝 ; 周星馳導演.
245 00 $a Shao lin zu qiu = $b Shaolin soccer / $c Huan yu yu le you xian gong si ; Xing hui hai wai you xian gong si ; bian ju Zhou Xingchi, Zeng Jinchang ; jian zhi Yang Guohui ; Zhou Xingchi dao yan.
546 ## $a In Chinese (Cantonese or Mandarin) with optional subtitles in traditional Chinese, simplified Chinese or English.【中文(粤语或普通话),可选繁体中文、简体中文或英文字幕。】

Guidelines for the use of ISO 639-3 language codes in MARC records (Approved Nov. 22, 2022; last revised: Nov. 30, 2022)

MARC记录中使用ISO 639-3语言代码指南(目次)

[一] 如何录入
[1] 书目记录:041字段语言代码
示例  041 07 $a fra $a gsl $2 iso639-3【字段第2指示符=7=来源由$2说明,子字段$2来源代码=iso639-3】
[2] 规范记录:377字段相关语言
示例  377 #7 $a leh $2 iso639-3
[二] 哪里找代码
[三] 宏语言
[四] 历史语言
[五] 示例
1. ISO 639-3为与资源相关的所有语言添加新信息【强烈建议添加】
2. ISO 639-3为与资源相关的某些语言添加新信息【强烈建议添加】
3. 与资源相关语言的ISO 639-3和MARC语言代码等效【不需要手动添加】
4. 无法确定与资源相关的至少一种语言的ISO 639-3语言代码【使用und表示未知;如果所有语言均未知,可不做】
5. 宏语言中的语言【首选具体代码而非宏语言代码】
附录:ISO 639-3和MARC语言代码(ISO 639-2/B)的不同
代码不同含意无不同【如汉语chi为zho,藏语tib为bod】
其他历史语言【有更多历史语言】
其他类型语言的附加代码【手语、人工语、古语言、已灭绝语言】
宏语言【如汉语宏语言zho与16种语言相关】
集合语言【ISO 639-3无等效代码,如凯尔特语(其他)cel,比亚语nub】
特殊代码【与MARC语言代码相同:mis(混杂语言)mul(多语言[6种以上])und(不确定)zxx(内容无语言)】

—— ISO 639-3 汉语代码 ——

指南提供了几个ISO 639-3代码来源,其中官方维护者SIL:https://iso639-3.sil.org/code_tables/639/data,缺点是没有语言名称的交叉引用(即异名参照)。

网站的ISO 639-3宏语言映射列表(ISO 639-3 Macrolanguage Mappings)https://iso639-3.sil.org/code_tables/macrolanguage_mappings/read,其中汉语列出16种(见下,除手语、洋泾滨英语外的15种在用语+文言文)。文言文lzh之外另有古汉语och,猜想或许用于甲骨文、金文之类的古文字。

附:在SIL查chinese结果近20个。显然不完整,但闽语、粤语分得特别细。大致按地域分类重排如下:

  • Collective+Genetic 集合【ISO 639-3无集合语言代码】

(639-5: zhx),Chinese (family)    

  • Macrolanguage+Living 宏语言+在用

zho(639-2/T: zho,639-2/B: chi,639-1: zh),Chinese【汉语】

  • Individual+Living 单个+在用
cmn,Mandarin Chinese【普通话/国语】
csl,Chinese Sign Language【中文手语】
cpi,Chinese Pidgin English【洋泾浜英语】
cjy,Jinyu Chinese【晋语】
czh,Huizhou Chinese【徽州话】
wuu,Wu Chinese【吴语】
gan,Gan Chinese【赣语】
hsn,Xiang Chinese【湘语】
hak,Hakka Chinese【客家话】
cdo,Min Dong Chinese【闽东话】
nan,Min Nan Chinese【闽南话】
cpx,Pu-Xian Chinese【莆仙话】
mnp,Min Bei Chinese【闽北话】
czo,Min Zhong Chinese【闽中话】
yue,Yue Chinese【粤语】
csp,Southern Ping Chinese, Southern Pinghua【桂南平话】
cnp,Northern Ping Chinese, Northern Ping Chingese, Northern Pinghua【桂北平话】
  • Individual+Ancient 单个+古代

och,Old Chinese【古汉语】

  • Individual+Historical 单个+历史
ltc,Late Middle Chinese【中古汉语】
lzh,Literary Chinese【文言文】

为BIBFRAME转换简化MARC格式

美国国会图书馆(LC)实施BIBFRAME已是箭在弦上,届时它将不再以MARC进行编目,代之以提供由BIBFRAME转换生成的MARC记录。为此,合作编目项目(PCC)于2022年初成立“BIBFRAME转换之MARC简化专责组”,其职责是检查LC的BIBFRAME2.0到MARC21转换程序和相关规范,据此开发一套简化的MARC字段,以准确有效支持BIBFRAME转换。年中和年末,中期报告和最终报告如期完成发布。见:

这套简化字段,在职责文件中称“瘦MARC”(Skinny MARC)。出于词义褒贬原因,小组先后考虑过一些其他术语,包括:简化MARC(simplified MARC)、基本MARC(essential MARC)BF2MARC用于BIBFRAME的MARC改编(MARC adaptation for BIBFRAME)链接MARC(linky MARC)。特别说明的是,需要与先前的“轻量级MARC”(MARC 21 LITE, 2008版)区别开来。小组称不推崇任何上述名称,但或许是出于表述简单的考虑,在最终报告中多用“BF2MARC”。

小组提出的BF到MARC字段表,称为“来自BIBFRAME的MARC描述性字段的初步曲目”(Preliminary Repertoire of MARC Descriptive Fields from BIBFRAME)。所谓“初步”,是因为提供的2个表格中,主表“MARC<-BF”只有90多个变长字段子字段(如020$a)或定长字段位置段(如008/07-10),其中还包括12个无对应的008字段位置段,实际有对应的只有80多对。副表“MARC not included”列出没有对应BIBFRAME元素的近130个子字段等(如130/240$a)。可以想见这离成品有多大距离,LC的BF/MARC转换已历多年,我原本以为据此提出一套简化MARC格式是件并不复杂的任务,如此结果真是出乎意料。

为此,最终报告概述首先指出:“我们团队认识到,当前的BIBFRAME环境还不够成熟,无法建立稳定可靠的MARC字段集以作为永久‘简化’集”。之后列举了小组工作的复杂性(摘录)【本人理解】:

  • LC 转换记录的可得性缺乏【LC没提供】
  • 同行示例的通行性缺乏【于是从开发Sinopia的[LD4]获取,但数据滞后于LC目前用的BF2.2,也没有用LC本地扩展bflc:】
  • 书目记录中罗马化的未来不确定性【LC4调查显示罗马化对图书馆运行与服务很重要,但LC更倾向于使用有限罗马化文字;亲历LC的BF到MARC转换在使用/不使用880字段间摇摆】
  • LC的BIBFRAME扩展(bflc) 的状态【主要款目在BF中没有对应物,只在扩展bflc:;BF新类Hub与240字段的关系】
  • 序列化MARC数据的不确定性【检索点1XX/6XX/7XX/8XX中不同子字段,对规范维护的影响】
  • 小组对专业格式的专业知识的限制

接着提出了9个希望PCC未来讨论的开放主题【略】

附录2,BIBFRAME到MARC 21(BF2MARC)转换原则和量规(摘录):

1、BF2MARC记录看起来将不像原生MARC【包括只带最少的ISBD标点淡化主要款目,但包含关系代码;可能用040或884字段中的代码标识转换生成的记录】

2、BF2MARC记录虽然不一定复制惯用的MARC技术或惯例,但仍应像传统MARC记录一样发挥作用,支持以下领域的基本机器和人类操作:a.提供所描述资源的明确标识;b.提供所描述资源的必要描述性细节;c.启用对书目检索点的受控检索;d.为书目检索点的存在提供合理的理由【附注】;e.启用对主题检索点的受控主题检索;f.提供足够的元数据出处以实现信任和管理。【这是小组的意见,更从涉及编目规则,LC是否认可?】

3、转换必然是一个有损的过程。BF2MARC数据的功能要求不是可以通过算法将其转换回BIBFRAME。

4、应允许并鼓励对BF2MARC记录进行后续的下游修改。