《资源描述与检索》(RDA)一统江湖?

(一)

    《资源描述与检索》(Resource Description and Access)第一部分草案公示后,在RDA讨论组引起了热烈讨论。目前公示截止期已到,最重量级的机构意见出台:

美国图书馆协会(ALA)意见(PDF文件;84页)
德国国家图书馆(DDB)图书馆标准办公室意见(PDF文件;15页)
英国图书馆与信息专家学会(CILIP)意见 (PDF文件;18页) [update 2006-4-19]

    ALA、CILIP(由英国图书馆协会LA及情报学家学会IIS合并组成)意见理所当然,DDB有什么关系?因为德奥两国也有改用AACR/RDA的意图(德奥两国改用MARC21格式)。

    RDA预计2007年定稿,2008年出版,另两部分草案预计也将在今年5月和10月相继出台公示。
    AACR:RDA联合修订委员会网站上的相关背景信息资料除英文版外,还有苏州大学图书馆陈家翠翻译的中文版(PDF文件)、法文版、西班牙文版。

(二)

    RDA与ONIX最近成立联合创新活动(RDA and ONIX Launch Joint Initiative),开发一个资源分类的共同框架。RDA自称“一部新的资源描述与访问的国际标准”,而ONIX则是“代表出版业的电子形式产品信息的国际标准”。
    美国国会图书馆联机目录利用ONIX数据已有多年,加强图书馆界与出版界在书目数据方面的协调,双方互利。
    有关ONIX,可以参见北京大学/CALIS联合编目中心喻乒乒在《现代情报》2006年第1期发表的“ONIX元数据标准2.1版与2.0版对比研究”。

(三)

    2007年,IFLA为拟议中的一部国际编目条例(an international cataloguing code for bibliographic description and access),将开完最后一次国际编目专家会议(IME-ICC)。IME-ICC是真正的系列“国际”会议,分别在欧美、南美、中东、亚洲、非洲五地召开,征求世界各地编目专家的意见,了解各国不同的编目实践。
    最近这一次将于IFLA2006年会期间在韩国首尔召开,应该是征求亚洲各国的意见。中国国家图书馆采选编目部主任顾犇是编目专业组的Secretary兼常务委员会成员,想必国家图书馆及其他国内编目领域专家也会积极参与。
    IME-ICC虽然连年开会,但“一部国际编目条例”用的是不定冠词+小写字母,同时IFLA也并没有按例设立编制委员会之类的机构,显示并非真的会有那么一个“条例”诞生。

(四)

    IME-ICC的积极主导者中,不乏AACR:RDA修订者的各级参与者。
    《英美编目条例》修订打算出第三版时,“资源描述与检索”原只是副题名,最终“扶正”,重要原因显然是要摆脱英语世界的局限。加上其扩大到图书馆领域以外的意图、独立于特定格式的目标,所以如果假设RDA就是IFLA的“an international catagloguing code”,大概不会差得太远。
    或许RDA日后真能一统江湖,成为纵揽各国、各类载体(包括网络)资源元数据描述的指导规则(用IFLA的话是“鼓励用作元数据应用框架中的内容标准”)。这也是我把description译作“描述”而不是“著录”的原因,后者图书馆专业味太浓,不易被广泛接受。


参见:

无处不在的元数据

    印象中以前数据库的”字段”,现在都称为元数据了,各行各业都在研制元数据,电子商务、企业信息、政务资源、统计指标、档案管理、电子公文、信用信息……。原来生成/修改日期、访问权限之类计算机文件的”属性”,也变成了元数据,如MP3文件的元数据ID3,定义了作曲家、词作者、演唱/演奏者等数十个属性;更有数码相片文件的元数据复杂到了定义拍摄的经纬度和海拔。
    曾以为Google的关键词检索只需要人工智能分析词间关系,组成一个词表(或许是语义网、本体什么的?),不需要元数据。但看着Google近半年接两连三地推出各种专类检索工具/功能,学者Google Scholar的引文、电视Google Video的节目预报、地图Google Maps的企事业单位信息、电影(movie:命令)的影评与影院信息,以及最近引起广泛争议的Google工具条的网页自动链接AutoLink功能,终于明白其实在Google简洁检索界面的背后,肯定蕴藏着极其复杂的元数据,用以组织机器搜集到的看似无序的信息。

    我们的机读目录MARC有差不多40年历史了,或许可称得上元数据的前辈。定义了那么多字段、子字段,虽然不是都要用,看上去也很烦。于是不满意MARC者设计出都柏林核心元数据DC,来代替烦琐的MARC,只用十多个元素就够了,很爽。可渐渐发现不够用,于是加修饰词,先是标准修饰词,然后又可以自定义修饰词,现在弄得跟MARC也相去不远了。
    其实当深入到事物的内部,必然越分析越细致,需要的元素也就越多,就好象前面所举MP3和数码相片元数据的例子。看出版商描述图书信息的元数据ONIX,近200个元素(tag),与MARC相比,其烦琐程度可说是有过之而无不及。
    看来,在今后相当长的一个时期里,综合描述各类文献元数据的MARC还是很安全的――不会被淘汰。或许磁带时代顺序读取的产物2709格式,会因与时俱进而被XML或别的什么格式所代替,但MARC的基本字段、子字段应该不会有太大的变化。