LC书目记录转换工具

远洋留言,介绍OCLC的xISBN和LC的书目记录转换工具。xISBN以前关注过,LC的这个工具却是闻所未闻:

Search LC Catalog by Standard ID
http://lcweb2.loc.gov/diglib/tools/html/searchStdNum.html
[update 2008-9-20网址改为:http://lcweb2.loc.gov:8081/cocoon/test/html/searchStdNum.html]

输入LC控制号(LCCN)、ISBN或ISSN,选择格式,即可返回相应格式的书目信息,繁简各不相同:

[owc] OpenWorldCat View (OCLC的Open WorldCat显示格式)
[marctags] MARC Tags View (MARC字段名格式)
[english] English Tags View (MARC文字说明格式)
[ser2dig] Ser2Dig MiniBib View (不明,似乎是LC所用Voyager系统的馆员用表格形式)
[srwdc] SRW Dublin Core XML Record (SRW DC XML记录)
[mods] MODS XML Record (MODS XML记录)
[none] SRU Result Set with MARC XML Record (MARC XML记录的SRU结果集,这种格式可以是多记录的)
[rss] RSS View (RSS格式,最简单的信息加链接,这种格式可以是多记录的)
[mods2rdf] RDF MODS XML Record (SIMILE version) (RDF格式的MODS记录,SIMILE版)

逐一试过,看来它是用不同的样式表来显示不同的格式(上段方括号中即样式表名称),基本句法是:
http://lcweb2.loc.gov:8081/diglib/admin/test/sru.xml?stdID=[LCCN/ISBN/ISSN]&stylesheet=[样式表名称]
(在没有样式表名称,或样式表名称有误时,显示[none]格式)

如“Information circular”一书的RSS格式(此书较旧,没有ISBN,用其LCCN号86655102):
http://lcweb2.loc.gov:8081/diglib/admin/test/sru.xml?stdID=86655102&stylesheet=rss

这应该是一种Web服务了,可以适应不同的格式要求。看URL,试验中,也没查到有关该工具的说明信息。未来会开放到什么程度?
远洋2007/11听LC书目控制未来工作组报告,第一感想是“Users不光是人,还有applications”。这就是LC面向机器用户的一个试验吧。
不过,编目员也是可用的,在没有Z39.50客户端的时候,此法查书目比用LC联机目录速度会快很多,只不知道数据是不是完整。

附:
远洋留言(发表于2008-01-23 01:08:47)
Thought you would be interested to know another tool:
It is a record conversion tool that have been developed at LC. : http://lcweb2.loc.gov/diglib/tools/html/searchStdNum.html
By typing an ISBN you would be able to see several formats for the item, including all popular ones related to MARC and MODS, as well as DC, RSS, RDF/MODS, etc.
Hope you can access it.

SIMILE: Semantic Interoperability of Metadata and Information in unLike Environments
http://simile.mit.edu/
SIMILE is focused on developing robust, open source tools that empower users to access, manage, visualize and reuse digital assets. Learn more about the SIMILE project.

ONIX记录数据库及Onix/UNIMARC对照表

    加州数字图书馆的 Roy Tennant 收集了10万多条出版社下载的ONIX记录,做了一个检索系统,提供题名、介绍、出版者和ISBN四个检索途径。
    检索结果除了简单的书目信息,一般还有目次与内容简介。当然最令人感兴趣的是它的 raw record,也就是ONIX记录。
    曾经在LC的MARC标准主页见过ONIX/MARC21对照表,所以识得ONIX的字段,但没有见过ONIX记录。就好象见过MARC手册,没见过2709格式。以前没有刻意找过,如今真是得来全不费功夫。

    在 Roy’s Prototype Space——ONIX Records for Libraries,除了上述检索系统,还有相关出版社ONIX记录样本,以及各出版社的获取记录方法页面链接。有鱼还有渔,真是不错。

    想到去ONIX主页逛逛,发现有“ONIX mappings to MARC”,MARC21对照表不但有LC版,还有OCLC的 Bob Pearson 版。尤其令人感兴趣的是还有UNIMARC对照表——ONIX / UNIMARC Mapping 由不列颠图书馆 Alan Danskin 制作。
    点击链接后才发现高兴太早,因为链去的BIC主页改版,对照表踪影全无。Google了一圈,全都只有链接,没有找到原文。或许要想法联系作者,才能得到那个Onix/UNIMARC对照表了。

关于ONIX:
The ONIX for Books Product Information Message is the international standard for representing and communicating book industry product information in electronic form.
Latest general release: Release 2.1 (revision 02)
For users in most countries, the current release is Release 2.1 revision 02, published in 2004, with some minor revisions to documentation in February 2005.

via: Catalogablog (2007-2-8)
ONIX Resource http://catalogablog.blogspot.com/2007/02/onix-resource.html

《中文图书标识数据》的指示符问题

    耄耋少年在“元数据研究思考(1)”中认为,MARC格式中的字段指示符实际上并没有用。并指出《中文图书标识数据》征求意见稿虽然用CNMARC,但是不用字段指示符,不知道图书馆界是否会认可。

    从MARC格式看,MARC21的字段指示符表达的含义其实还是比较丰富的,如说明题名的出处与类型(封面、书脊等),说明附加责任者/题名的类型(相关或分析)等。相对而言,UNIMARC及与之兼容的CNMARC的字段指示符确实用处不大,因为UNIMARC或者用不同的字段来表达不同的含义,或者干脆就不加区分(如相关题名、附加责任者等不区分是否为分析)。这就形成了UNIMARC的指示符基本上都用缺省值的局面,所以一般看来,不用也不会产生什么大的麻烦。
    从书目数据角度,对数据质量有要求的图书馆,从出版发行渠道来的数据基本上是弃之不用的;对数据质量没什么要求的图书馆,哪怕直接由EXCEL表转换来的书目数据也照用不误。至于两者在质量及使用效果上的差异肯定是存在的,但相关的调查怕是很难进行,也没有见到过详细的分析。

    标准固然应该与时俱进,但也要考虑与国际标准的兼容,毕竟我们的书目数据还是有与国外数据进行交换的需要的。在UNIMARC没有改变之前,要求CNMARC先行创新,恐怕难以实现。
    以我之见,如果《中文图书标识数据》要用CNMARC格式,为了看上去更“专业”一些,让推广更顺利或者说得到图书馆编目界的认可,还是应该用指示符——都用缺省值就行了,不过就在标准各处多加一项,说明某某字段用什么指示符而已。有点小麻烦的是,个别字段的指示符国图与CALIS有差异,需要先行协调确认。

    回到《中文图书标识数据》采用CNMARC与DC这个问题。我还是以为类似标准采用国际通行标准如ONIX、今后配套转换程序更好。ONIX中大量的电子商务数据,有助于提高出版社采用的积极性。
    虽然我不了解情况,但把当初CIP没有用CNMARC当作CIP数据未能广为采用的主要原因,怕是说不过去的。如果有心推广使用CIP数据,做个转换成CNMARC的程序,那还不是小菜一碟?

参见:

《中文图书标识数据》(征求意见稿)观感

书蠹精:标识性编目和ONIX