读秀──MARC免费收集系统

    一个月前,OCLC公布了新的WorldCat记录的利用政策(Policy for Use and Transfer of WorldCat® Records),引起国外博客圈热烈讨论(OCLC Policy Change),反对声音激烈,认为OCLC赋予自己的权利过大。有意思的是,国内却完全是另一番风光,联合编目中心似乎并不在意保护自己的利益,面对厂商大规模收集MARC记录的明显意图,还没有向图书馆提出相关建议。

   
最近几个月,经常听到图书馆说买读秀,也已经有不少大馆购买了,还有整个省团购的。读秀是什么?我至今也不是很明白,因为没花时间去了解。但我知道,它有
一个重要功能:籍此免费获取图书馆的MARC记录──图书馆在每年付以十万为单位的银子订购读秀的同时,还要向读秀免费奉送自己所有馆藏的MARC数据。
花不菲代价买东西,不是商家附送什么优惠,反而要把自己那么多数据拱手相送,听上去匪夷所思,却不幸是事实。
   
当我第一次听说时,当然要问“为什么”?丫枝给我的答案是“要在读秀的网站加本馆的链接,直接链在OPAC中显示本馆是否有此书的纸本、电子“。后来知道,只是在读秀网站加本馆链接,读秀并不提供在本馆OPAC上显示读秀链接的方便。而要达到在读秀网站加本馆链接的结果,图书馆本来只需要提供极简单的几个信息就可以实现,即题名、作者、出版社、出版年(如果有ISBN当然更方便)。
   
这里不想推测读秀要图书馆提供MARC记录的真实意图。现在有不少图书馆人觉得编目是浪费时间,因为那些书目信息出版的时候已经全有了。其实编目员很多时间花在给分类号、主题词这些主题标引,以及做作者、团体的名称规范。虽然分类法、主题词表乃至规范库很不令人满意,但这些信息是对出版物不可或缺的内容揭示。新一代OPAC要实现分面展示,让读者在输入最初的检索词后,只需简单点击展示的链接,就可以完成随后的检索并得到需要的文献,这在很大程度上依赖于由编目员增加的信息,因为这些信息是进行书目数据挖掘的基础。真正有眼光的人是不会小视编目员增值的数据的。
   
除了信息价值,图书馆的MARC数据也是有经济价值的,它们是图书馆积累一二十年的数字化资产,怎能轻易送人?每家图书馆的MARC记录,小馆也会有数万
条,大馆甚至可达百万数量级。或许某些MARC数据来自书商的“免费”提供,但那是图书折扣的一部分;或许某些MARC数据来自联合目录,下载每条只需
0.10元,但即使只有10万条,也值一万元呢,更何况,那是联合目录对成员的优惠,事实远不只这个价。

   
据说读秀的书目已经不少于160万了,随着越来越多的图书馆购买读秀,这个数量还会增长,因为它在销售的同时,也在一举两得地收敛书目数据。在这一过程中,损失最大的无疑是那些联合编目中心。说到了影响他们生死存亡的阶段,或许有些言过其实,但形势确实很严峻。如CALIS联合编目中心,对详编记录支付每条2元的费用,这些年来,也该支付了数百万元;同时还制定了严格的质量标准并多方进行质量控制。现在,这些高质量的数据,不需分文,几乎转眼间大多已经或即将成为读秀的囊中之物,令人感觉不可思议。
    或许图书馆觉得自己没什么损失,那些MARC记录,放着也是放着,又不能卖钱。但是,数据是Web2.0时代最重要的财富。当读秀得到了所有的MARC数据,图书馆在与读秀的下一轮谈判中,将会处于什么样的地位?
    据说读秀现在还只要中文的,未来还会要外文的。读秀得到这些数据,可以做什么?至少现在,图书馆提供的MARC数据使读秀在极短时间内成了一个巨大的联合目录。接下来还能做什么,可以展开一下想象力……

   
应该说,图书馆从联合目录合法下载的MARC记录有使用权,但未必有所有权,可以随便送给厂商。国内知识产权不完善,现有的联合编目中心对图书馆没有那么大的约束力,但至少那些中心可以知会图书馆,请馆长注意保护MARC数据──如前所说,要达到在读秀网站加本馆链接的结果,只需要提供极简单的几个信息就可以实现,不需要提供完整的MARC记录。众所周知,2709格式的MARC记录是不可直接使用的,从使用角度,或许EXCEL表格的书目信息更方便处理。如果读秀一定要求MARC数据,而有的图书馆系统无法导出简编记录,或者不知道如何将导出的完整MARC记录转成简编记录,联合编目中心完全可以提供一个小软件,快速实现这样的转换。

PCC实施废除440字段

合作编目项目(Program for Cooperative Cataloging)发布“PCC Guidelines for Field 440”(1页PDF),建议成员馆从2008年10月24日起废除440字段,以490 1代替。

490字段第1指示符“1”的新定义:
1 – Series traced in 8XX field
New Definition:
When value “1” is used, the appropriate field 800-830 is included in the bibliographic record to provide the series added entry.

改变440字段的建议早在6月6日即已提出(MARC Proposal No. 2008-07)。背景声称是由于440字段既是丛编描述又是规范检索点,其实这又有什么关系呢?LC不再维护丛编规范记录,使440没有存在的根基才是真正的原因。讨论中曾想取消490 1,但由于大多数图书馆的丛编索引取决于490第1指示符,最终确定从文字上修改第1指示符“1”的定义。
如果取消490 1,对编目员来说就省事了,直接在8XX字段著录就是了,而按现在的决定,是要在8XX重复。大部分情况下,书上的丛编描述与丛编规范是一致的。

由于丛编规范名不再存在,同日提出的另一项与之相关的建议(MARC Proposal No. 2008-06)是在800-830及490中增加$3,说明所用丛编名适用的范围或时段。看实例比看说明省事得多:
例一:
830 #0 $3 1980: $a DHEW publication $x 0090-0206
830 #0 $3 1982- $a DHHS publication $x 0276-4733
例二:
830 #0 $3 <May 1986-> $a Tourism research series.
例三:
830 #0 $3 v. 1-8 $a Collection Byzantine $x 0223-3738
830 #0 $3 v. 9 $a Collection des universités de France $x 0184-7155
例四:
490 1#    $3 <1981->:  $a Reference works
830 #0    $a Reference works.
例一、例三的两条830字段应该是分别出现在两条不同的书目记录中的,而例四的则是同一书目记录中的两个不同字段。由此也可以看到490与830其实是完全一致的。

via Catalogablog: Field 440

背景:
2006-4-20 LC宣布停止对丛编的规范控制,2006-5-1 实施
网上反对签名达 3495 个
2006-5-4 LC宣布推迟到2006-6-1实施
2006-5-11 LC专业人员协会执委会通过“对LC管理层停止生产丛编规范记录生产的决议”
2006-6-1 LC停止创建丛编规范记录

CNMARC与CMARC对照表

    青树教育基金会想要将开源图书馆集成系统Koha用到中国贫困地区的中学图书馆,在本地化时却发现现在编目模块有了对台湾CMARC的支持,还没有对CNMARC的支持。
    对软件开发一窍不通,前些天在大旗底下QQ群中发布相关信息时得知,要做本地化投入不小。但CMARC与CNMARC同样源自UNIMARC,差别不大,或许有了CMARC的基础,后续工作量就不那么大了?
    今天看到毛庆祯翻译的Koha 2.2简介,看来CMARC部分源自Paul POULAIN 的法文UNIMARC版Koha,亦非重起炉灶。这就是开源的力量了。

    因之,根据国家图书馆2004年的《新版中国机读目录格式使用手册》,以及网上找到的台湾《中國機讀編目格式》第三版(1989),作了一个简单的CNMARC与CMARC对照表,目前只到字段一级。希望能对Koha简体汉字版开发者有所帮助。

参见:
广告:Koha开源社区·中学图书馆志愿者
(2008-9-6)
开源OPAC也精彩 (2007-01-14)

关于Koha参见: