通用MARC记录转换器USEMARCON

    上月看到Catalogablog介绍大英图书馆的通用MARC记录转换器(USEMARCON Plus――The Universal MARC Record Convertor)。因为时常会被问及MARC格式转换的问题,当即去USEMARCON Plus网站一看究竟。

    USEMARCON是”User Controlled Generic MARC Converter”(用户控制通用MARC转换器)简称,软件始于1995-1997年间欧盟资助的一个项目User controlled Generic MARC converter。软件除自带多种MARC格式转换外,还可以通过提供文本格式的转换规则表,自行增加需转换的MARC格式。目前可下载的最新版是USEMARCON Plus v1.71,由芬兰赫尔辛基大学图书馆Ere Maijala开发增补,主要的改进是可以集成进其它软件,可在Z39.50客户端和多线程Z39.50服务器中临时转换。
   
    只要填一个电邮地址就可以下载,文件usemarcon171.zip仅529KB,解压后不足2M。只是那个可执行文件似乎是在DOS窗口运行的,一闪而过后就不见了。当时以为是家中机器太破,无奈之下只得放弃。前两天在U盘中看到这个被遗忘的usemarcon171.zip,就在工作用机器上解压、运行一番,结果相同。

    不得已回家看附说明文件,在解压后的documentaton文件夹中,还是旧版的(2004年1.51版)。安装说明(Install_lib.rtf)表明适合于Window 95以上,没有问题。再看用户手册(Useman_lib.rtf),几乎晕倒――居然真是在MS-DOS方式下运行的,标准的命令行方式:

usemarcon my.ini [input file] [output file]

    再看解压后文件夹,其实只带了一个转换格式,即UNIMARC到UKMARC的文件夹(uni2uk),其中有一个uni2uk.ini。正好手边有一个CNMARC文件,用来一试,没有成功:

C:Downloadsusemarcon171usemarcon171>usemarcon uni2ukuni2uk.ini 200607.sol 200601.sol
USEMARCON – MARC record converter
Standalone Batch version 1.71
Adapted by Crossnet Systems Limited under contract to The British Library
Adapted by ATP Library Systems Ltd, Finland, 2002-2004
Adapted by The National Library of Finland, 2004-2006
Copyright 2001 – The British Library, The USEMARCON Consortium

Loading .ini file parameters…
Size of input file: 62911 bytes
Conversion progress:
END non OK :Maximum errors to be encountered has been reached

看错误报告(errlog.txt),大量的是格式通不过(CNMARC与UNIMARC差别没这么大吧),也有字符编码的问题。

    要解决字符编码问题,得看技术手册(Techman_lib.rtf)。其实不看技术手册,只看看uni2uk文件夹中二十多个文件,就知道要向该转换器提供一个“转换规则表”,并不是一件容易的事。

    或许它所擅长的正是“集成进其它软件,可在Z39.50客户端和多线程Z39.50服务器中临时转换”,而不是直接用来做MARC格式转换。


参见:
Keven&aposs Blog数图研究:大英图书馆的马克转换工具