谢琴芳“FRBR用户任务对CALIS联合目录编目实践的影响”笔记

1  FRBR用户任务及其与书目记录的关系
    FRBR入门

2  CALIS联合目录书目现状对用户任务实现的障碍
    谢老师对联合目录中记录现状肯定头痛得很,对“障碍”的总结有着大量数据与实例(虽然没有举例)为基础。
    前几天写“
FRBR化:在我国实施的难点”,部分可与谢老师的此部分作个对比。
2.1 分立式目录对用户任务实现的障碍
    谈的是CALIS中、西、日、古籍数据库分列问题。我的第四部分“书目数据库、MARC格式、CNMARC/XML转换表”谈的问题范围大致与此点相同。谢老师没有谈到MARC格式不同问题,大概也是这个问题比较好解决。
2.2 资源描述规则对用户任务的影响
    谈的是中文编目规则的差异,潜台词当然是CALIS与国图在规则上的不一致了。还有回溯或其他简编记录问题。
2.3 检索点的设置对用户任务的影响
    主要讲统一题名问题。我的第一部分“文献原题名的著录问题”也谈统一题名,但范围仅限译著。谢老师强调要增加统一题名,但没有涉及统一题名的形式。
2.4(书中误为2.3) 编目实践中的一些模糊概念对用户任务的影响
    举CALIS联合目录数据库中大量被合并的重复记录的数据,分析因识别“作品/内容表达/载体表现”模糊而产生的重复记录。其实还有不少没有被合并的重复记录。或许用“作品/内容表达/载体表现”概念向编目员灌输,有助于解决重复记录问题。

3  CALIS联合目录系统实现用户任务的策略
3.1 以用户任务为目标,强化资源描述和检索标准
(1)…对内容和载体互交叉的资源,优先考虑以内容类型特征作为定义资源类型范畴的基础,但在资源描述时应综合考虑两者的特征。
(2)注重不同资源类型之间著录与检索标准的协调性与一致性…
(3)以FRBR四个层级的书目实体概念作为指导编目员创建书目记录的原则,以加强书目记录的可识别性。
3.2 以FRBR书目实体模式为目标,为下一代OPAC的开发作准备

    CALIS联合目录第三阶段将开发基于FRBR模型的OPAC――第三代OPAC。“第三代OPAC的设计是以层次结构向书目使用者展示作品、内容表达、载体表现和单件之间的关系”,也就是“FRBR化”了。
    谢老师没有给出具体的实现方式。没有迹象表明CALIS会如
RedLightGreen那样,将所有数据库记录转换成XML格式输出。RedLightGreen这种模式需要同时维护两种不同类型的库,解决两类数据库的数据同步更新(记录增加、修改)问题。不知道RedLightGreen是不是同步更新,又是如何实现更新的?

原文出处:中国图书馆学会2005年年会征文优秀论文集
中国图书馆学会编《以人为本 服务创新》(北京图书馆出版社2005,297-303页)

 

2005中图学会年会中的FRBR

    E线图情上“中国图书馆学会2005年年会”专题报道,昨天把八个分会场的有关信息都发了出来。
    关注第五分会场:“
文献信息描述、组织进展与展望”。总共七个报告:

  • 陈树年(华东理工大学)“近年来来我国信息组织研究进展与趋势”(主题报告)
  • 谢琴芳(北京大学)“FRBR用户任务对CALIS联合目录编目实践的影响”(专题报告)
  • 曹宁(国家图书馆)“试论FRBR在中国文献编目规则和机读目录格式中的应用”(专题报告)
  • 曾程双修(美国华人图书馆员协会)“从幅编到英美编目规则第三版和规范管理”(专题报告)
  • 张沙丽(美国北卡罗莱纳大学)“规范控制与全球信息资源共享”(专题报告)
  • 高红(国家图书馆)“FRBR与信息资源编目领域若干问题的探讨”(专题报告)
  • 刘炜(上海图书馆)“元数据与知识组织”(专题报告)

    刘炜显然并未与会。他穿着著名的马夹,年会期间天天博客不止,内中无一丁点谈到年会,自然是没有到桂林去的。

    如此,六个报告中有三个以FRBR为主题,占50%。除陈树年的主题报告和二位美籍人士曾程双修与张沙丽外,谢琴芳、曹宁和高红,人人均讲FRBR。
    呜呼!如果不知FRBR、不懂一点FRBR,还真没办法在编目界混了。今后期刊编辑录用编目文章就简单了,不谈到点FRBR,立马枪毙  :)(我可没想误导大伙儿啊)

    看这些报告题目,真是很诱人:FRBR + 联合目录、编目规则、MARC格式,AACR3、规范控制,……
    期待年会组织者回到北京后,在中图学会网站将这几个报告挂上去(应该有PPT吧),让未与会者也能享享眼福。

    好象学会年会一年比一年有意思了。看来从今天开始,要考虑治疗一下自闭症,争取明年有胆量与会 *-*

更新(2005/7/25)
    刚看到年会论文集《以人为本 服务创新》(中国图书馆学会编,北京图书馆出版社 2005),收录了上述陈树年、谢琴芳、曹宁、Sally C. Tseng(曾程双修)和刘炜的论文。
    Sally C. Tseng论文题目是:From FRBR to AACR3 and Authority Control。原来中文标题中令人费解的“幅编”就是FRBR啊!
    呜呼,FRBR队伍再一次壮大。Keven在评论中说“FRBR可能成为我们专业的下一个泡沫”,现在这个泡泡更大了。

 

FRBR化:在我国实施的难点

   FRBR作为一个概念模型,用以指导实践,出现了如题所示的新名词――FRBR化(Google目前搜索结果:FRBRize,动词112项;FRBRizing,动名词182项;FRBRization,名词183项)。
    定义?“FRBR化”还是个非正式的称呼。
OCLC如是说

examine the issues associated with the conversion of a set of bibliographic records to conform to FRBR requirements.
This process sometimes is informally referred to as “FRBRization”. (转换书目记录集以符合FRBR需求的过程)

    RLG(美国研究图书馆集团)的“红绿灯”RedLightGreen,可以说是最早实用的FRBR化大型WEB书目数据库。通过将FRBR的“作品――内容表达――载体表现――个别资料”四级实体简化为二级“作品――版本(载体表现)”,RLG把自己的联合目录放到了互联网上。在搜索结果显示页面,显示的是作品,而非一般OPAC的“载体表现”。对大部分用户,感兴趣的是作品而非某一个版本;如果只对某一版本感兴趣,再继续看相关版本不迟。对于高产作家的作品,此种显示方式尤能显示出其优点(请参见“红绿灯RedLightGreen”及“FRBR影响之OPAC应用”)。

    从RLG及LC、OCLC等的FRBR化成果看,以“作品”这一实体集中书目记录,可以说是FRBR化的一种基本形式。但这一方式,在我国实施起来似乎还麻烦多多。试分析原因:

一、文献原题名的著录问题

    MARC 21记录普遍采用原题名作统一题名,为作品的集中创造了良好的条件。而中文编目中并没有规则要求以原题名作统一题名,目前CNMARC一般将“在编文献中出现的”原题名著录于510并列题名中。
    并列题名并不一定是原题名,还包括自译题名。有些译著,并列题名与原题名并不一致。此时,或者做二个并列题名,或者著录时根本就省略了原题名,这就为集中同一文献留下隐患。

    《新版中国机读目录格式使用手册》中有个实例,在编图书《来自地狱的女人》为“If tomorrow comes”的某个译本,统一题名采用另一个译名《假如明天来临》,而非原题名(此书还有一译名《假若明天来临》)。如此一来,没有题名规范记录即无法著录统一题名,增加了问题的复杂程度。
    原题名可以不著录,而要著录另一个被选为“统一题名”的译名。是不是有些奇怪?于是“统一题名”的选择面对疑惑:为什么选这个译名而不选另一个译名?
    这种做法还增加了统一题名维护的工作量,每出版一个不同题名的译本,就要维护一下题名规范记录。
    直接用原名不好吗?为什么要自己累自己呢?

    另外,图书出版不规范,有意无意“省略”原题名的情况随处可见。从另一方面为实施原文统一题名增加了不小的难度。
    记得一次用MARC 21做某中文译著合集的记录,费了九牛二虎之力才找齐全部原题名。虽然很有成就感,毕竟只能当作消遣,如果当工作来做,死路一条。

二、名称规范问题

    要确认是否同一作品,单靠题名显然是不够的,还需要责任者名称。中文编目中人名规范不普及,编目中缺乏足以信赖的名称规范档,责任者名称经常照录图书题名页。图书翻译、出版中各译各名的现象本就普遍,于是,同一作者各种译法,五花八门。
    有了规范意识后,又存在盲目依据人名翻译辞典的现象,有时就把有名的作者“规范”成了无人知晓的责任者名称。

    与题名一样,翻译图书还经常不提供原作者名称,造成名称规范工作有心无力。

三、不同语种名称标目形式不同问题

    这或许是集中不同语种同一作品的最大障碍。
    “红绿灯”的做法是全部使用拉丁字母,对于非拉丁语名称(题名与责任者)采用音译,如中文图书用汉语拼音。这当然是计算机技术发展早期无法处理其它语种字符时留下的后遗症,虽然现在“红绿灯”已将字符集转换为Unicode,原来已经编目的文献是无法逐一更改的了。韦氏音标可以用计算机批量改成汉语拼音,要由拼音改成汉字则是不可能的。

    我们自然不会全部用拼音。但因为用户不习惯用作者原名查,或者根本不知道作者原名拼写,我们反其道而行之,将作者原名全部音译成汉字。
    不过,既然同名异译现象如此普遍,使用名称规范档已不可避免。那么,我们何不在书目记录中直接使用原名?而通过名称规范将读者输入的汉译名导向书目记录?

    日本对作者标目即采用原文。以“If tomorrow comes”为例,NII(国立情报学研究所)的WebCat中某日文译本“明日があるなら”,作者标目为“Sheldon, Sidney”,而非题名页中的“シドニィ?シェルダン”。

    目前CALIS设计的名称规范库是各语种统一的,对同一作者不同语种记录间的连接无疑是十分有益的。但同一责任者采用不同标目形式的通行做法,在进行数据处理时,无疑为集中同一作品(哪怕是OPAC显示)增加了相当大的困难。

四、书目数据库、MARC格式、CNMARC/XML转换表

    Last but not least,在我国,常见的情况是中西文(或者还有日文、俄文等等)书目数据库各自独立,还采用不同的机读目录格式。各语种书目数据库分列,对于依“作品”集中所有语种书目记录的不便显而易见。不同的MARC格式,又增加了问题的复杂性。
    这种状况不是著录问题,不是修改一下编目条例/著录规则、机读目录手册就可以得到改善的。基本上可以说其本身是不会改变的,只能信赖外部技术。

    就现在来看,通过为不同MARC类型分别定义索引字段的方式,一些图书馆自动化系统已经较好地解决了不同MARC格式书目记录合库问题。现在需要解决的主要问题就是不同数据库各自独立的问题。
    只能寄希望于跨库检索技术的发展。集中同一作品的问题不是简单的重复结果去重,首先需要判定出各库中的同一作品,然后再对所有检索结果重新组合显示。

    不过,如果采用“红绿灯”的方式――他们实际上是将所有记录重新转换成XML格式――那么一个库还是多个库的问题就不存在了。
    我们需要做的,是建立一个CNMARC到XML的转换表,与LC已有的MARC/XML转换表(
MARCXML: MARC 21 XML Schema)一起使用,一举解决多库、多MARC问题。

参见本人FRBR相关博客文章:

红绿灯RedLightGreen (2005年02月28日)

FRBR影响之OPAC应用 (2005年05月10日)

书目记录四种实体的汉译 (2005年05月20日)

FRBR博客 (2005年06月30日)