由亚马逊数据直接获取MARC记录

    Catalogablog介绍了一个编目工具(Cataloging Tool):Outagamie Waupaca图书馆系统的Charles Ledvina,创建了一个使用亚马逊的商品XML数据创建MARC记录的工具。只需输入亚马逊的商品编号ASIN,程序就会返回一个相当完整的MARC记录。如果用Firefox浏览器,还提供有greasemonkey脚本(下载),可以实现同样功能。

    到chopac网站上看这个“Amazon to Marc Converter”工具:

 由亚马逊编号提供MARC记录

输入ISBN(亚马逊在没有ISBN号的情况下用自己的ASIN),“go”就可以生成MARC记录。生成的MARC记录可编辑,并且可以“Download”成2709格式,方便转入书目系统。

    生成的MARC记录,从字段上看还是相当完整的,充分利用了可获得的信息。另外亚马逊的编者评论作为摘要,也可以为读者提供不少信息。
    自动生成问题自然是有的,主要是规范方面,首先责任者名称就是未经规范的。另外比较明显的是主题,虽然标成LCSH的,但一眼便知不过是些关键词。因之头标标为完整级,自然也是说不过去的了。
    然而无论如何,在需要原始编目的情况下,让这个工具生成一下,还是可以省不少力的。

    展望一下,如果该系统(或类似系统)再增加一些“智能”,与规范系统做一些链接处理,高质量的自动MARC编目似乎已不是那么遥不可及的了。

 

出版社成为图书馆外包商

    《出版人?图书馆与阅读》宣传号(2006年7月),报道了多家出版社或成立图书馆服务/装备部,或在网站上设置图书馆专区,有些还提供MARC数据。

    看了五家出版社网站: 

    人民邮电出版社的图书馆区做得最用心,而化学工业出版社下载书目定制性较好。五家都在网站上提供信息含量不一的EXCEL格式订购目录,其中人大出版社和人民邮电出版社还提供MARC格式编目数据。化学工业出版社则称联系出版社,可以获得电子书目、采访数据、现采查重,“第一时间提供新书采访数据(CNMARC、DBF、XLS格式)”。
    最有意思的是人大出版社,分别提供国图编目数据CALIS数据。从MARC记录看,似乎指的不是数据提供者,而是指数据符合某方标准。不过两种数据基本都是按国图格式的(头标、丛编、版本等),差别似只在拼音,一个用$A、一个用$9。而邮电社的记录则为CALIS格式的。国图与CALIS数据格式不一致,还真是让出版社困惑呢。

    从营销方面考虑,在网站上提供MARC数据主要为书商提供方便,书商免费得到大量MARC数据,降低向图书馆配送MARC记录的成本。而对图书馆来说,在网上直接获取MARC数据,无论按类别、按时间还是定制方式,都没有什么意义。要降低编目成本,图书馆更需要的是像书商那样的现采配送MARC记录。这对于有MARC数据的出版社来说是完全可以做到的。

    该宣传号第39页记者韦英平的“以馆配为龙头:机工社全面做大销售渠道”,介绍机械工业出版社的图书馆服务模式:“业务流程上,实施科学化管理,形成了一套从采访编目、图书加工(如盖馆藏章、贴标等)到物流服务的科学化、系统化的业务流程。”原来出版社也变成图书馆的外包商了。文中还说,清华大学、人民邮电、化学工业、建筑工业、法律出版社等大社都在加强图书馆直销业务。

 

CALIS联合目录与国家图书馆的不一致问题――LCSH更新的启示

    前几天,在杭州参加CALIS联合目录用户委员会第三次会议,质量控制组成员有一个议题是讨论“中文团体名称规范”。因为CALIS联合目录规范库前期建设已进入最后阶段,完成中文团体部分,就可以正式投入使用了。
    由于CALIS联合目录制定的著录规则与国家图书馆在诸多方面不一致,导致大陆及港台多方质疑。为能与国图保持一致,CALIS积极参与第二版《中国文献编目规则》的编制。不过,据说有些原来争论确定的内容,最终出版已非原来面目,让参与编写的CALIS一方很是郁闷。
    更令人郁闷的是,国图的做法也不完全依据《规则》。在这种情况下,《规则》是否还具有其权威?为名称规范,CALIS已经投入很大人力,期间团体名称形式还做过多次更改。在目前状况下,是否要完全按《规则》做,就存在了很大的疑问。讨论的结果是保持现状。
    对于团体名称规范方面,据说国图不完全依据《规则》的原因是,书目库中现有的数百万条记录无法更改。听到这种说法,当时我的想法是,只要确定规范形式,完成规范记录,书目记录按规范作全域更新即可,不存在无法更改的问题。

    今天看到博客“图书馆果汁”(Library Juice)上一篇“芭芭拉访谈”(Interview with Barbara Tillett),才感到,具体操作时需要考虑的问题,实际上远没有外人想象的那么容易。同时,只要本着积极的态度,总是可以期望找到解决问题之途的。
    芭芭拉是美国国会图书馆编目政策与支持办公室(CPSO)主任(她是编目领域的名人,还有一大堆其他头衔),此番就美国国会图书馆标题表(LCSH)接受博主Rory Litwin访问。起因是Sanford Berman撰写专著批评LCSH改革不够,用词欧洲中心、男性至上、污辱与晦涩等等。芭芭拉的回应,既说明LCSH不断进取的现状,又表明积极改进的态度。可以说通过博客这个平台,为LCSH好好地做了一回宣传。

    通读全文,有以下心得:

1、技术变化才使很多事情成为可能。LCSH已有百多年历史,尽管一直在更动,但直到1981年卡片目录关闭后才能做更多改变。比如第一次世界大战,在1981年前一直是“欧战”(European War, 1914-1918),之后才改成“世界大战”(World War, 1914-1918)。毕竟逐个改卡片不是好玩儿的。

2、现有技术不一定能解决所有问题。在LCSH中,基督教的神“上帝”直接用 God,而其它教的神就要另加限定词,如“安拉”用 God, Muslim。对于一个多民族的国家,这样做显失公平。但由于 God 在LCSH还指泛称的“神”,这就导致不能直接将 God 通过全域更新改成如 God (Christianity) 这样的形式。

3、需要不断探索解决问题的方法。仍是对 God,现在已经找到了解决方法,就是配合使用分类号,确定其含义是泛称的“神”还是基督教的“上帝”。

    就是老毛的话:“世上无难事,只要登攀。”