通用MARC记录转换器USEMARCON

    上月看到Catalogablog介绍大英图书馆的通用MARC记录转换器(USEMARCON Plus――The Universal MARC Record Convertor)。因为时常会被问及MARC格式转换的问题,当即去USEMARCON Plus网站一看究竟。

    USEMARCON是”User Controlled Generic MARC Converter”(用户控制通用MARC转换器)简称,软件始于1995-1997年间欧盟资助的一个项目User controlled Generic MARC converter。软件除自带多种MARC格式转换外,还可以通过提供文本格式的转换规则表,自行增加需转换的MARC格式。目前可下载的最新版是USEMARCON Plus v1.71,由芬兰赫尔辛基大学图书馆Ere Maijala开发增补,主要的改进是可以集成进其它软件,可在Z39.50客户端和多线程Z39.50服务器中临时转换。
   
    只要填一个电邮地址就可以下载,文件usemarcon171.zip仅529KB,解压后不足2M。只是那个可执行文件似乎是在DOS窗口运行的,一闪而过后就不见了。当时以为是家中机器太破,无奈之下只得放弃。前两天在U盘中看到这个被遗忘的usemarcon171.zip,就在工作用机器上解压、运行一番,结果相同。

    不得已回家看附说明文件,在解压后的documentaton文件夹中,还是旧版的(2004年1.51版)。安装说明(Install_lib.rtf)表明适合于Window 95以上,没有问题。再看用户手册(Useman_lib.rtf),几乎晕倒――居然真是在MS-DOS方式下运行的,标准的命令行方式:

usemarcon my.ini [input file] [output file]

    再看解压后文件夹,其实只带了一个转换格式,即UNIMARC到UKMARC的文件夹(uni2uk),其中有一个uni2uk.ini。正好手边有一个CNMARC文件,用来一试,没有成功:

C:Downloadsusemarcon171usemarcon171>usemarcon uni2ukuni2uk.ini 200607.sol 200601.sol
USEMARCON – MARC record converter
Standalone Batch version 1.71
Adapted by Crossnet Systems Limited under contract to The British Library
Adapted by ATP Library Systems Ltd, Finland, 2002-2004
Adapted by The National Library of Finland, 2004-2006
Copyright 2001 – The British Library, The USEMARCON Consortium

Loading .ini file parameters…
Size of input file: 62911 bytes
Conversion progress:
END non OK :Maximum errors to be encountered has been reached

看错误报告(errlog.txt),大量的是格式通不过(CNMARC与UNIMARC差别没这么大吧),也有字符编码的问题。

    要解决字符编码问题,得看技术手册(Techman_lib.rtf)。其实不看技术手册,只看看uni2uk文件夹中二十多个文件,就知道要向该转换器提供一个“转换规则表”,并不是一件容易的事。

    或许它所擅长的正是“集成进其它软件,可在Z39.50客户端和多线程Z39.50服务器中临时转换”,而不是直接用来做MARC格式转换。


参见:
Keven&aposs Blog数图研究:大英图书馆的马克转换工具

 

网上编目参考资源一览

    首页的“编目标准网站”和“书目资源网站”链接越来越长了。现略作整理、补充,整理成一篇放在此。本表不求齐全,以实用为主,“著录与格式”、“分类、主题与著者号”部分提供的都是有全文或部分全文的资源,“书目资源”部分提供的是部分国家的国家图书馆或主要联合目录的WebPAC。

著录与格式

书目记录的功能需求(FRBR) (http://www.ifla.org/VII/s13/frbr/frbr.htm)
国际标准书目著录(ISBDs) (http://www.ifla.org/VI/3/nd1/isbdlist.htm)

简明UNIMARC书目格式 (http://www.ifla.org/VI/3/p1996-1/concise2.pdf)
UNIMARC手册:规范格式 (http://www.ifla.org/VI/3/p2001/guideindex.htm)

MARC 21官方网站 (http://www.loc.gov/marc/)

JAPAN/MARC格式 (http://www.ndl.go.jp/jp/library/data/jmarc.pdf)
JAPAN/MARC(UNIMARC版) (http://www.ndl.go.jp/jp/library/data/ndlunimarc.pdf)

OCLC书目格式与标准 (http://www.oclc.org/asiapacific/zhcn/bibformats/default.htm)
CALIS编目中心业务文件 (http://www.calis.edu.cn/calis/lhml/lhml.asp?fid=FA0307&class=2)
中科院联合编目系统标准与规范 (http://159.226.100.141/Union/user_info.jsp)


分类、主题与著者号

中国图书馆分类法 (http://202.196.16.22/reaguide2/clc/index.asp)
中图法(四版)查询系统 (http://www.33tt.com/tools/ztf/)
中国图书馆分类法(第四版)简本(130页; PDF文件)

美国国会图书馆分类法 (http://www.loc.gov/catdir/cpso/lcco/lcco.html)
杜威十进分类法(DDC) (http://www.oclc.org/dewey/resources/summaries/default.htm)
国际十进分类法(UDC) (http://www.udcc.org/outline/outline.htm)

ACM计算分类法 (http://www.acm.org/class/1998)
数学主题分类法(MSC) (http://www.ams.org/msc)
物理与天文学分类法(PACS) (http://publish.aps.org/PACS/)
光学分类与标引体系(OCIS) (http://www.osa.org/pubs/ocis/)

日本十进分类法(NDC新订9版) (http://www.asahi-net.or.jp/~ax2s-kmtn/ref/ndc/ndc.html)
日本国会图书馆分类表(NDLC) (http://www.ndl.go.jp/jp/library/data/ndl_ndlc.html)

美国国会图书馆标题表(LCSH) (http://fantasia.cs.msstate.edu/lcshdb/index.cgi)
医学主题词表(MeSH) (http://www.nlm.nih.gov/mesh/meshhome.html)
日本国会图书馆件名标目表(NDLSH) (http://www.ndl.go.jp/jp/library/data/ndl_ndlsh.html)

克特著者号码表 (http://librarian.or.kr/reference/mark/cutter1.htm)
LC克特表 (http://www.itsmarc.com/crs/cutr0001.htm)


书目资源

美国国会图书馆规范库 (http://authorities.loc.gov)

美国国会图书馆目录 (http://catalog.loc.gov)
美国国会图书馆Z39.50网关 (http://www.loc.gov/z3950/)
OCLC Open WorldCat (http://www.oclc.org/worldcat/open/tryit/)
RedLightGreen (http://www.redlightgreen.org)

加拿大国家目录 (http://amicus.collectionscanada.ca/aaweb/aalogine.htm)

澳大利亚国家图书馆目录 (http://catalogue.nla.gov.au/)
澳大利亚图书馆搜索 (http://librariesaustralia.nla.gov.au/apps/kss)

不列颠图书馆集成目录 (http://catalogue.bl.uk/)
英国Copac联合目录 (http://copac.ac.uk/copac/)

德国图书馆Z39.50网关 (http://z3950gw.dbf.ddb.de/)
德国卡厄斯鲁尔虚拟目录KVK (http://www.ubka.uni-karlsruhe.de/hylib/en/kvk.html)

法国联合目录 (http://www.ccfr.bnf.fr/accdis/accdis.htm)

日本国会图书馆目录 (http://opac.ndl.go.jp/)
日本NACSIS联合目录
 (文本版: http://webcat.nii.ac.jp)
 (图形版: http://webcatplus.nii.ac.jp)

韩国国立中央图书馆搜索
(http://www.nl.go.kr/nlmulti/search/broad_search/search/search_brief.php?lang_mode=c1)

中国国家图书馆联机公共目录查询系统 (http://www.nlc.gov.cn/res/index.htm
    (“浏览”方式可兼查规范记录)
CALIS公共目录检索系统 (http://opac.calis.edu.cn/)
台湾地区图书联合目录 (http://nbinet1.ncl.edu.tw/screens/opac_menu.html)


另请参见:

Z39.50相关信息链接 (http://catwizard.blogchina.com/4829892.html)
编目研讨信息源 (http://catwizard.blogchina.com/4763872.html)
最佳编目参考网站 (http://catwizard.blogchina.com/4049985.html)
西文编目网络在线资源 / 新陆 (http://catwizard.blogchina.com/4595072.html)

更多内容请用首页的“站内搜索”查找。

 

名称主题与名称规范――由国家图书馆的做法谈起

    看全国图书馆联合编目中心网上咨询,觉得特别有意思的是关于“将被传的人名作为自由词著录在610字段”的解答(为方便阅读,作了分段处理):

关于个人名称主题词的增词程序
    国家图书馆中文图书主题标引在个人名称主题词的增词程序上可以2003年为界限,2003前国家图书馆书目数据使用文津编目系统,文津编目系统是一种区域网络编目系统,它只在国家图书馆内实现了区域联机编目,并没有实现互联网络,也没有做到书目数据库与汉语主题词库的挂接,这一时期国家图书馆书目数据个人名称主题词的增词程序是宽松的,只要有必要就可以增词标引。
    2003以后,国家图书馆书目数据使用了以色列联机编目系统,实现了互联网络,也做到了书目数据库与汉语主题词库的挂接,这时我们发现专有名词主题词的大量增加对汉语主题词库的可持续发展产生了不利影响,尤其以个人名称主题词的大量增加最为突出。
    汉语主题词库的词量是相对稳定的,在不断增加一些新的主题词的同时,也会删除一些过时的、没有使用价值的主题词,大量的个人名称主题词的涌入势必对汉语主题词库的发展与维护产生不利影响。
    过去传记类图书比较严肃、相对也较少,被立传的人物大多是历史上有名的人物或对当代历史有深远影响的人物,出书的目的也与经济利益无关,但是现在传记类图书比以前多了,而且不乏娱乐性的、纯粹以盈利为目的的图书,这也是我们改变个人名称主题词增词程序的一个重要原因。
    现在的做法如下:对一些使用频率极低或从长远发展的眼光来看、很快会失去检索价值的专有名词(个人名称、机构名称)采取变通的办法,在不影响检索效率的情况下,用自由词的形式著录在610非控主题词字段,其文献采用上位词标引。
[实例举了做610的张国荣、陈强、韩金英、海南琼台师范学校,此处略]
……需要说明的是并不是所有个人名称第一次出现时都不能增词标引,对一些非常重要的人物标引员应该有预见的在第一次出现时就增词标引,比如中共中央新一代领导人、世界上有影响的大国总统等。

    简言之,国图这样做的理由是人名主题太多,影响《汉语主题词表》。撇开其对个人或机构“重要”性的判断是否合理不谈,其实,包括个人名称、团体名称、会议名称在内的名称主题以及题名主题,与主题词表可以说没有什么关系。没有收录主题词表,并不意味着不能用作规范的主题。或者说,只要是做过规范的名称,当需要做主题时,就应当作规范主题,而不是自由词。
    举个大家都很熟悉的例子,LCSH中基本上不包含人名/机构/会议(但包括文学作品中虚拟人物名称),但当作为研究对象而需标引主题时,LC记录仍把人名/机构/会议放在名称主题字段(600/610/611),而不是非控的索引词字段(653)。
    为什么可以这样做呢?因为这些人名都是做过名称规范的。在机读目录规范格式中有一个“是否用于主题”的设定(MARC21的008/15,UNIMARC的106)。只要在做名称、题名规范时设定可用于主题,就不必将形式完全相同的名称规范与名称主题分别做两条记录(题名规范与题名主题同),简化了规范数据库(含名称、题名与主题)的维护工作。可以看一下LC规范中的莎士比亚(Shakespeare, William, 1564-1616),曾经同时做过主题规范(LCCN为sh 85120820),但目前是作为名称规范(LCCN为n 78095332)。
    换言之,《汉语主题词表》(汉语主题词库)中本无需收录名称主题,名称主题只要利用名称规范库就可以了。

    名称主题的数量相对于普通名称规范(责任者)而言,可以说少之又少,没有理由不将其规范化。按照建立规范的一般规则,国家图书馆在做名称规范时,并没有要求作者有相当的名气或者非常“重要”,何以对主题却另有一个标准呢?
    想来或许是没有利用MARC规范格式中的上述设定,或许与国图所用Aleph系统有关。从OPAC检索(浏览方式)看,国图的书目库不仅与主题规范库是相连的,与名称规范库(人名、题名等)也是相连的。是系统本身对主题规范与人名、题名规范的处理尚有瑕疵?还是对系统的使用不够到位?
    LC的书目数据库与没有与规范数据库连接。规范数据库检索能够显示命中的书目记录数,可见两个数据库是有关联的,但也没有提供与书目数据库的连接。不知道是不是Voyager系统没有解决有关问题的缘故?