从联合目录到融合目录

香港中文大学五十周年,5月底主办“第三届学术图书馆馆员国际学术会议”,名为“求同存异 动静阴阳 未来联校图书馆之合作与竞争”,专注于图书馆联盟相关话题:
主题1──学术图书馆联盟的管治:平衡、优先次序和评价
主题2 ──合作性的馆员培训:优点、陷阱和最佳典范
主题3──存取和储存共享纸本及数码馆藏的尖端方法:开放还是封闭的系统
主题4──集中统一馆藏管理和技术服务:不可避免或可以避免?

香港中文大学张宝珍和刘丽芝的报告,介绍该馆电子书编目批处理情况,尤其详细介绍了与CALIS联合目录合作,获取超星电子书MARC数据。
From union catalogue to fusion catalogue: how collaborative cataloguing might be initiated and implemented in the Hong Kong context (PDF链接)

香港中文大学图书馆目录和CALIS联合目录,在采用的编目规则、主题词表、分类法、MARC格式、编目语言上均不相同。但在数据处理过程中,除了转换CNMARC到MARC21之外,他们确定的基本原则是:尽可能接受CALIS的数据,允许混合的编目语言(换言之接受中文)。在2010年10月到2011年9月的一年间,历经评估、测试、转换、修改到实施批处理,完成了需要的70多万条记录。得到的记录强化了名称规范与主题及其他信息。

对于“融合目录”,报告人如此说明(p.16):
– 过去:
— 依据统一的编目实践
— 喜欢书目记录高度一致
– 现在:
— 引入采用不同编目规则和不同完整级别的供应商记录
— 接受“最小级记录比根本没有记录对图书馆用户有利”

对于上述变化,报告人的总结是:
– 经验1:变化是必然的 (p.20)
— 理想:完全遵照单一编目标准及本地惯例
— 现实:不同编目数据集混杂在一起
— 对用户来说,直接、即时获取所需图书馆资源,比标准编目记录更重要
– 经验2:妥协是必需的 (p.21)
— 同意尽可能保留CALIS原始数据,仅在“充分且必要”时才做修改
– 经验3:协作是可能的 (p.22)
— 当接受变化,编目员愿意接受编目实践上的差异
— 接受大学教育资助委员会(UGC)资助且订购超星数字图书馆的大学图书馆,可以协作强化批处理的电子书MARC记录

all things cataloged博主对此的评论是:
“RDA即将来临,遗留数据将与新数据并列,还有按不同RDA政策决定(交替/可选、编目员判断)创建的数据。如果联盟及/或全球共享编目继续,我们最终将不得不告别我们相当封闭的世界观,接受非统一的、经混合的书目信息。”

——虽然报告标题是“从联合目录到融合目录”,但所谓“融合目录”并非联合目录的替代或升级,这里的“联合目录”或许只是提示来自联合目录的数据。
——如同两位报告人说的,包含不同编目标准数据的“融合目录”就是现实(我们这里也一样),不是由个人可以避免或改变的。
——并且,未来肯定不会仅限于电子资源记录。

via all things cataloged: From union catalog to fusion catalog (2013-6-7)(有墙)

外包、联合目录及数字出版

    老马在“编目未来”下留言,要我谈谈对外包与联合目录关系的看法。
    去年初看到《加州大学书目服务再思考》,提到“外包大部分MARC编制工作”时,就有一个很大的疑惑:如果高水平的编目机构都把MARC编制工作外包出去了,那么联合目录的书目数据从何而来呢?
    那天参加编目中心年会,得知上图就在给加州大学做外包。后蒙纪陆恩赠送与庄蕾波合著《境外合作编目理论与实践》,也了解到国外的外包不只是给外包商,还包括海外专业机构。联想到一位大学同学,前几年就在为美国图书馆代购国内图书,并在国内做好符合OCLC要求的书目数据,也是一种编目外包吧。这些书目数据,最终都会收录到联合目录中,所以联合目录应该不愁数据来源。

    老马担心外包对国内联合目录的负面影响,我也有同样的担心。美国在四十年代有编目危机之说,原因之一是由于合作编目的发展,为合作编目所制定的标准化编目规则造成的编目条款激增,导致编目效率相对下降,待编文献积压。我们目前似乎也处于这样的状态,为了要达到标准化,编目员的很多时间花在了一些机械化的操作上,很多情况下并无助于目录职能的改善。由于效率问题,编目部门很容易受到馆领导的质疑,而图书馆参与联合目录的积极性也因之受挫。这也是我之所以对简化编目格式持积极态度的主要原因,核心级记录、访问级记录、……,都应该是我们的目标。我们应该有提高编目效率的简化标准。
    这只是问题的一方面,问题的另一方面是联合目录不够强大,既不能完全反映图书馆的馆藏,也没让图书馆觉得不反映有什么不方便。联合目录功能单一,馆际互借还处于襁褓期,文献传递又自成一体,联合目录未能融入图书馆的日常服务之中。OCLC的联合目录是馆际互借的依托,worldcat.org可以变成图书馆的本地目录,因而图书馆会把自己的所有馆藏信息都交给它。我们的联合目录做不到,甚至还刻意地回避这样做。结果是,外包的书目数据是否进入联合目录成为一个问题,联合目录的发展堪忧。
    当然,上面的联合目录其实特指CALIS了。以国图、上图等大机构为依托建立的联合目录,不用担心数据来源,因为主体馆藏数量本身就足够庞大,即使没有其他来源,也可供其他馆作一个优秀的下载来源。只是这些联合目录的功能就更单一了,基本上无法反映成员馆的馆藏,如果发展馆际互借,单向性更明显。

    自己对外包的运作所知甚少,无论是商业机构还是联合目录。就书目来源方面,商业机构无论是否选择套录联合目录数据,都需要有一批人做原编;而像OCLC这样的联合目录做外包,又将如何处理没有收录的图书?或者还要有一个附属的部门做原编?

    另:关于多来源数据对图书馆的适用性。国会图书馆书目未来工作组报告草案把图书馆置于从作者到读者的书目信息供应链中的一个普通环节(The library is … only one link in the supply chain of bibliographic information between author and reader),应该也是中肯的。另一方面,图书馆界也有必要参与到这个供应链的上游,让原始的数据适应图书馆的需求。RDA在与ONIX合作研究,耄耋少年也一直在呼吁图书馆界参与国内出版业标准的制定,不知中图学会、国家图书馆(如书蠹精)是否已经介入相关工作?

附:老马的留言:
很想听听精灵老师对外包与联合目录关系的看法。外包盛行的日美两国,联合目录同样很发达。我不知道日本情况如何,至少在美国像OCLC那样的联合目录巨擘也是最大的编目外包商。反观国内的情况很令人沮丧。联合目录刚刚起步,却在外包“风”前摇摇欲坠了(但愿是杞人忧天)。国内外包商目前基本上游离于联合目录(不是说它们不去用联合目录的数据,大的外包商往往拥有几个联合目录的数据,小的就难说了。),它们从联合目录中抽走的不仅是客户,而是数据与资源,即联合目录赖以生存的馆藏数据与书目数据。当然也有单位私下把账号授予外包商代为上传数据的,但这毕竟不合法。外包商现在打的是经济牌,数据白送,哪有馆长不动心的,你编目员同它们是“不平等竞争”。但哪天没了“免费午餐”(可能就在外包普遍化之时),馆长们对“外包”的热情可能又会减退。
有人总担心外包数据影响质量。我倒并不以为然。既然数据来源多样化,还有什么数据不敢要。但我不知道“目录职能”之类的经典论述还灵不灵?毕竟根据“目录职能”,仅仅能“检索”是不够的。确实,从图书生产到图书进馆,其中有许多书目数据,但不同数据的“职能”肯定不同。书商的书目首先是推销图书,他的书目怎么跟图书馆的需求协调呢?当然“数据强化”不失为有效的方法,但这么一“强化”,它的成本是否就会比以前少了呢?而且什么数据该强化,什么不该强化,其标准又在哪呢?怎么操作呢?另外编目部(或者将来其他什么部)养着“强化”馆员,恐怕馆长看着就不顺眼。

参见:
编目未来 (2007-12-20) /posts/20071217183148.html
OPAC 2.0计划书:《加州大学书目服务再思考》 (2006-02-02) /posts/20060202195927.html
《书目控制未来报告》(草案)解读 (2007-12-05) /posts/20071205221125.html
《资源描述与检索》(RDA)一统江湖?(2006-04-16) /posts/20060416102200.html
《中文图书标识数据》(征求意见稿)观感 (2007-01-21) /posts/20070121221436.html
(链接有耄耋少年多篇相关博文)

耄耋少年:
图书馆人的责任 (2007-12-22) http://blog.sina.com.cn/s/blog_4bd4c87b010081q3.html
图书馆界对数字复合出版系统有那些要求?(2007-12-19) http://blog.sina.com.cn/s/blog_4bd4c87b010080s9.html
数字出版当前最需要的是实现ECIP (2007-12-06) http://blog.sina.com.cn/s/blog_4bd4c87b01000blz.html