合作编目计划(PCC)日前发布《MARC记录中使用ISO 639-3语言代码指南》。
目前MARC(包括CNMARC)所用语言代码为ISO 639-2,ISO 639-3是在其基础上扩展的,含近8千个语言代码(也是3字母)。
PCC提出在书目和规范记录中使用ISO 639-3进行编码,目的是为用户提供更准确精细的语言信息,特别是对于土著语言、手语、历史语言和人工语言,以及更好地识别某些语言(如汉语和阿拉伯语)的视听资料记录中的口语或歌唱语言。
需要说明的是, ISO 639-2实际上由两个标准组成:ISO 639-2/B(书目,MARC所用语言代码)和ISO 639-2/T(术语)。两者涵盖相同的语言,但在某些情况下代码不同,而ISO 639-3使用ISO 639-2/T代码。
指南规定继续使用MARC语言代码进行编目(书目记录008/35-37及041字段),只在找不到具体代码的情况下,选用附加的041字段记录ISO 639-3语言代码。无论代码是否相同,只要使用ISO 639-3代码没有增加有关资源语言的附加信息,就无需使用ISO 639-3代码创建041字段。如果有多种语言,找不到MARC语言代码但有ISO 639-3代码,则只做ISO 639-3编码的041字段。
未来可能会开发宏或其他自动化手段,由ISO 639-3语言编码生成ISO 639-2语言代码字段,从而避免重复编码。
指南规定,对于ISO 639-3中认为的宏语言(语言家族),应尽可能使用最具体的代码。以汉语为例,其标准书面语使用代码cmn(普通话/国语),不用对应MARC代码chi的宏语言代码zho(汉语)。示例5.4. 粤语影音资料:
008/35-37 (Lang): chi 041 1# $a chi $j chi $j eng $h chi(中文对话,中英双语字幕,译自中文) 041 17 $a yue $a cmn $j cmn $j eng $h yue $2 iso639-3(粤语、普通话对话,普通话、英语字幕,译自粤语) 245 00 $a 少林足球 = $b Shaolin soccer / $c 寰宇娛樂有限公司 ; 星輝海外有限公司 ; 編劇周星馳, 曾 謹昌 ; 監製楊國輝 ; 周星馳導演. 245 00 $a Shao lin zu qiu = $b Shaolin soccer / $c Huan yu yu le you xian gong si ; Xing hui hai wai you xian gong si ; bian ju Zhou Xingchi, Zeng Jinchang ; jian zhi Yang Guohui ; Zhou Xingchi dao yan. 546 ## $a In Chinese (Cantonese or Mandarin) with optional subtitles in traditional Chinese, simplified Chinese or English.【中文(粤语或普通话),可选繁体中文、简体中文或英文字幕。】
Guidelines for the use of ISO 639-3 language codes in MARC records (Approved Nov. 22, 2022; last revised: Nov. 30, 2022)
MARC记录中使用ISO 639-3语言代码指南(目次)
[一] 如何录入 [1] 书目记录:041字段语言代码 示例 041 07 $a fra $a gsl $2 iso639-3【字段第2指示符=7=来源由$2说明,子字段$2来源代码=iso639-3】 [2] 规范记录:377字段相关语言 示例 377 #7 $a leh $2 iso639-3 [二] 哪里找代码 [三] 宏语言 [四] 历史语言 [五] 示例 1. ISO 639-3为与资源相关的所有语言添加新信息【强烈建议添加】 2. ISO 639-3为与资源相关的某些语言添加新信息【强烈建议添加】 3. 与资源相关语言的ISO 639-3和MARC语言代码等效【不需要手动添加】 4. 无法确定与资源相关的至少一种语言的ISO 639-3语言代码【使用und表示未知;如果所有语言均未知,可不做】 5. 宏语言中的语言【首选具体代码而非宏语言代码】 附录:ISO 639-3和MARC语言代码(ISO 639-2/B)的不同 代码不同含意无不同【如汉语chi为zho,藏语tib为bod】 其他历史语言【有更多历史语言】 其他类型语言的附加代码【手语、人工语、古语言、已灭绝语言】 宏语言【如汉语宏语言zho与16种语言相关】 集合语言【ISO 639-3无等效代码,如凯尔特语(其他)cel,比亚语nub】 特殊代码【与MARC语言代码相同:mis(混杂语言)mul(多语言[6种以上])und(不确定)zxx(内容无语言)】
—— ISO 639-3 汉语代码 ——
指南提供了几个ISO 639-3代码来源,其中官方维护者SIL:https://iso639-3.sil.org/code_tables/639/data,缺点是没有语言名称的交叉引用(即异名参照)。
网站的ISO 639-3宏语言映射列表(ISO 639-3 Macrolanguage Mappings)https://iso639-3.sil.org/code_tables/macrolanguage_mappings/read,其中汉语列出16种(见下,除手语、洋泾滨英语外的15种在用语+文言文)。文言文lzh之外另有古汉语och,猜想或许用于甲骨文、金文之类的古文字。
附:在SIL查chinese结果近20个。显然不完整,但闽语、粤语分得特别细。大致按地域分类重排如下:
- Collective+Genetic 集合【ISO 639-3无集合语言代码】
(639-5: zhx),Chinese (family)
- Macrolanguage+Living 宏语言+在用
zho(639-2/T: zho,639-2/B: chi,639-1: zh),Chinese【汉语】
- Individual+Living 单个+在用
cmn,Mandarin Chinese【普通话/国语】 csl,Chinese Sign Language【中文手语】 cpi,Chinese Pidgin English【洋泾浜英语】 cjy,Jinyu Chinese【晋语】 czh,Huizhou Chinese【徽州话】 wuu,Wu Chinese【吴语】 gan,Gan Chinese【赣语】 hsn,Xiang Chinese【湘语】 hak,Hakka Chinese【客家话】 cdo,Min Dong Chinese【闽东话】 nan,Min Nan Chinese【闽南话】 cpx,Pu-Xian Chinese【莆仙话】 mnp,Min Bei Chinese【闽北话】 czo,Min Zhong Chinese【闽中话】 yue,Yue Chinese【粤语】 csp,Southern Ping Chinese, Southern Pinghua【桂南平话】 cnp,Northern Ping Chinese, Northern Ping Chingese, Northern Pinghua【桂北平话】
- Individual+Ancient 单个+古代
och,Old Chinese【古汉语】
- Individual+Historical 单个+历史
ltc,Late Middle Chinese【中古汉语】 lzh,Literary Chinese【文言文】