名称主题与名称规范――由国家图书馆的做法谈起

    看全国图书馆联合编目中心网上咨询,觉得特别有意思的是关于“将被传的人名作为自由词著录在610字段”的解答(为方便阅读,作了分段处理):

关于个人名称主题词的增词程序
    国家图书馆中文图书主题标引在个人名称主题词的增词程序上可以2003年为界限,2003前国家图书馆书目数据使用文津编目系统,文津编目系统是一种区域网络编目系统,它只在国家图书馆内实现了区域联机编目,并没有实现互联网络,也没有做到书目数据库与汉语主题词库的挂接,这一时期国家图书馆书目数据个人名称主题词的增词程序是宽松的,只要有必要就可以增词标引。
    2003以后,国家图书馆书目数据使用了以色列联机编目系统,实现了互联网络,也做到了书目数据库与汉语主题词库的挂接,这时我们发现专有名词主题词的大量增加对汉语主题词库的可持续发展产生了不利影响,尤其以个人名称主题词的大量增加最为突出。
    汉语主题词库的词量是相对稳定的,在不断增加一些新的主题词的同时,也会删除一些过时的、没有使用价值的主题词,大量的个人名称主题词的涌入势必对汉语主题词库的发展与维护产生不利影响。
    过去传记类图书比较严肃、相对也较少,被立传的人物大多是历史上有名的人物或对当代历史有深远影响的人物,出书的目的也与经济利益无关,但是现在传记类图书比以前多了,而且不乏娱乐性的、纯粹以盈利为目的的图书,这也是我们改变个人名称主题词增词程序的一个重要原因。
    现在的做法如下:对一些使用频率极低或从长远发展的眼光来看、很快会失去检索价值的专有名词(个人名称、机构名称)采取变通的办法,在不影响检索效率的情况下,用自由词的形式著录在610非控主题词字段,其文献采用上位词标引。
[实例举了做610的张国荣、陈强、韩金英、海南琼台师范学校,此处略]
……需要说明的是并不是所有个人名称第一次出现时都不能增词标引,对一些非常重要的人物标引员应该有预见的在第一次出现时就增词标引,比如中共中央新一代领导人、世界上有影响的大国总统等。

    简言之,国图这样做的理由是人名主题太多,影响《汉语主题词表》。撇开其对个人或机构“重要”性的判断是否合理不谈,其实,包括个人名称、团体名称、会议名称在内的名称主题以及题名主题,与主题词表可以说没有什么关系。没有收录主题词表,并不意味着不能用作规范的主题。或者说,只要是做过规范的名称,当需要做主题时,就应当作规范主题,而不是自由词。
    举个大家都很熟悉的例子,LCSH中基本上不包含人名/机构/会议(但包括文学作品中虚拟人物名称),但当作为研究对象而需标引主题时,LC记录仍把人名/机构/会议放在名称主题字段(600/610/611),而不是非控的索引词字段(653)。
    为什么可以这样做呢?因为这些人名都是做过名称规范的。在机读目录规范格式中有一个“是否用于主题”的设定(MARC21的008/15,UNIMARC的106)。只要在做名称、题名规范时设定可用于主题,就不必将形式完全相同的名称规范与名称主题分别做两条记录(题名规范与题名主题同),简化了规范数据库(含名称、题名与主题)的维护工作。可以看一下LC规范中的莎士比亚(Shakespeare, William, 1564-1616),曾经同时做过主题规范(LCCN为sh 85120820),但目前是作为名称规范(LCCN为n 78095332)。
    换言之,《汉语主题词表》(汉语主题词库)中本无需收录名称主题,名称主题只要利用名称规范库就可以了。

    名称主题的数量相对于普通名称规范(责任者)而言,可以说少之又少,没有理由不将其规范化。按照建立规范的一般规则,国家图书馆在做名称规范时,并没有要求作者有相当的名气或者非常“重要”,何以对主题却另有一个标准呢?
    想来或许是没有利用MARC规范格式中的上述设定,或许与国图所用Aleph系统有关。从OPAC检索(浏览方式)看,国图的书目库不仅与主题规范库是相连的,与名称规范库(人名、题名等)也是相连的。是系统本身对主题规范与人名、题名规范的处理尚有瑕疵?还是对系统的使用不够到位?
    LC的书目数据库与没有与规范数据库连接。规范数据库检索能够显示命中的书目记录数,可见两个数据库是有关联的,但也没有提供与书目数据库的连接。不知道是不是Voyager系统没有解决有关问题的缘故?

 

德奥两国改用MARC21格式

    ALA冬季会议期间,德国国家图书馆的Reinhold Heuvelmann在MARBI会议上发布信息,说明德国与奥地利图书馆正在改用MARC21。会后Reinhold应建议将有关内容发布在MARC论坛上

    德、奥两国原来使用MAB作为书目数据的交换标准(同样基于2709格式),著录依据RAK(描述性编目规则)和主题标引依据RSWK(主题标目规则)。MAB由德国国家图书馆维护。
    近两年MAB开始国际化进程,包括采用Unicode、FRBR及MABxml。2001年开始讨论放弃RAK与MAB,转用AACR2和MARC21。2002-2004年,实施AACR和MARC21的可行性研究与分析,并于2004年12月作出决定,用MAB代替MARC21。

改用MARC21的目标与理由:

方便访问国际书目数据;
使德语图书馆的数据在世界范围内“可见”
更便于混合不同来源的书目数据
进入MARC共同体
利益于基于MARC的开发
引入德奥两国的经验
升级时对图书馆系统有更多的选择

困难与风险

避免:失去所需信息与功能
MARC21并不提供所有MAB的数据结构(如记录链接)
转向MARC不是免费的
德、奥对MARC21了解不够

步骤与方法(略)

已经完成与接下来的步骤

初始MARC培训完成,将作进一步培训
关于集合性著作的推荐做法:1、丛编各卷单独做记录;2、记录必须尽可能完整;3、为丛编做附加记录。
下个月做MAB到MARC21的映射,计划今年夏天前给出最终版本。
下一步将完成翻译。
已经完成字符集映射。

    计划在2007年初做好准备。从那时候开始,德奥图书馆将转用MARC21。


    最有意思的是,他们还没有给计划一个正式的名称,但有一堆设想,征求大家的建议:

Change for MARC 21
Moving to MARC 21
Transition to MARC 21
Switching to MARC 21
Meta-Exchange (i.e. Exchange of the exchange format)


    论坛中对德奥两国是否同时采用AACR2有疑问,因为AACR2本身日子已经不多了。Reinhold的回复是,德奥将修订自己的编目条例RAK,因而正积极参与AACR2的修订。不过该计划的网页名称却是“Changing for International Formats and Codes (MARC21, AACR2)”?看不懂德文,不知道其最终报告中是如何表述的。

 

中国少数民族语言代码

    最近碰到一批中国少数民族语言图书,又为语言代码头痛。以前找不到代码的,也不动脑子,一律用sit(汉藏语系其它语种)。这回书不少,不得已稍微补一补语言分类知识――发现自己太想当然了。原来中国少数民族语言除汉藏语系外,还有有芬匈语系、阿尔泰语系、印欧语系、南亚语系和南岛语系。理论上说,如果找不到各语种相应代码的话,就应该用所属语系、语族或语支的代码(标有Other)。
    发现一部分套录到的国家图书馆记录用的一些语言代码,在各版《中国机读目录格式使用手册》中都没有。经请教G君,才知道在《中文图书机读目录格式使用手册》(全国图书馆联合编目中心, 国家图书馆图书采选编目部. – 华艺出版社, 2000)附录A中有“我国主要少数民族语言代码”24种。两相对比,才发现原来这个“我国主要少数民族语言代码”有不少问题。不知道是不是因此《中国机读目录格式使用手册》才不收入?
    以下是按两种手册所取我国部分少数民族语言代码,包括可以在《中国机读目录格式使用手册》中找到确切代码的语言共28种。其中sit为汉藏语系(其它)、tut为阿尔泰语系(其它)、mkh为孟高棉语族(其它)。

    我国部分少数民族语言代码表

中图类号    语言    中国手册    中文手册    备注
H212        蒙古语    mon         mon     
H214        藏语      tib         tib     
H215        维吾尔语  uig         uig     
H216        苗语      hmn         mia       Hmong
H217        彝语      sit         yiz     
H218        壮语      zha         zhu     
H219        朝鲜语    kor         kor     
H221        满语      mnc         man       man表示Mandingo(西非语言)
H236        哈萨克语  kaz         kaz     
H237        柯尔克孜语

         
(吉尔吉斯语)kir         kir     
H238        乌孜别克语uzb         –     
H241        塔吉克语  taj         –     
H242        塔塔尔语  tar         –     
H243        锡伯语    tut         xib     
H244        俄罗斯语  rus         rus     
H251        瑶语(曼语)sit         yao    Yao(Africa)并非瑶语
H252        白
语(民家语)sit       bay     
H253        傣语      tai         dai     
H254        哈尼语    sit         han     
H255        佤语(本人语)mkh       way     
H256        傈僳语    sit         lis     
H257        纳西语(么些语)sit     nax     
H258        拉祜语(保语)sit       lah     
H259        景颇语    sit         jip     
H266        普米语(西番语)sit     pum     
H268        布依语    sit         buy     
H272        侗语      sit         don     
H282        京语(越南语)vie       jin     

    由上表可见,苗语、壮语、满语没有使用标准代码(傣语存疑),并且满语所用代码与现有代码冲突。另外,两种手册都有的错误是瑶语,在LC代码表中注明Yao (Africa),可见并非瑶语。

    代码是外国人定的,它们或许没见到过某些文字的出版物,便没有给特定代码。作为我们国家的国家图书馆,为本国语种作些定义绝对必要。只是在做这件事的时候:

  • 首先,不能与现有代码冲突,这样会造成国际书目数据交换的混乱;
  • 其次,应该通过适当途径使我们的标准为国际标准所接纳。2000年正式出版的代码,至今仍未在更新的国际标准中见到,可见做得是不够到位的。
  • 第三,如果没有必要为所有中国少数民族语言设置代码,至少也应该提供所有(而不是“主要”)这些语言应当使用的代码一览表。作为手册类工具书,制作代码表不应当偷懒……

附记:
因为语言知识贫乏,上述依据《中国手册》给出的代码或许也有错误之处。敬请指正!