OCLC软件竞赛结果

    时间过得很快,今天见到OCLC软件竞赛结果公布,找我以前的报道,发现时间竟然已经过去四个多月了。
    得奖者是美国的Dazhi (David) Jiao,看姓名是个来自大陆的华人。 获奖作品是一个OPAC,在显示详细书目记录时,包含收割的相关文献一览表(an OPAC that includes a ranked list of harvested citations when a detailed bibliographic record is displayed.)。评委认为其作品创新集成了OPAC与收割的元数据,并充分利用了OCLC的开放软件(an innovative way of integrating OPACS with harvested metadata and made good use of open source software from OCLC)。

    OCLC还提供了相关信息链接。获奖作品的链接如下:
Dazhi Jiao&aposs CAT OAI; an OPAC System with OAI Integration
http://129.79.32.196:8080/catoai/index.jsp

    这个试验系统目前只包括物理学相关内容。检索结果一览表如同普通OPAC,但具体书目的详细信息包含按相关度排序的数字资料,这些资料由OAI数据库中收割而来。
    “The Handbook of plastic optics”一书的详细书目信息,首条数字资源的详细信息,包括名称、URL、作者、内容提要、主题等信息。直接链接到相关数字资源,是一篇全文文献,感觉很不错。

    OCLC打算今后每年举办一次这样的竞赛。

 

ISBN-13正式登场

    2005年1月1日,谋划已久的13位ISBN的转换进程正式开始。2年后,ISBN-13将完全取代10位的ISBN。其实多年前正式出版的图书上,条码位置已同时印有ISBN和ISBN-13,只是当时以978开头的13位的数字是作为图书的商品编号,而非书号。
    与编目有关的问题是:什么时候开始著录?著录在什么字段?图书馆编目系统的相应升级是否已经完成或至少放到了议事日程?

    美国国会图书馆启动最早,计划2004年10月1日就开始处理ISBN-13。到2007年1月1日前的转换过渡时期,将同时著录出版商提供的同一文献的两个ISBN号(10位和13位)。2007年后将只著录ISBN-13。
    在2004年6月的美国图书馆协会ALA年会上,机读书目信息委员会MARBI曾经讨论过MARC 21著录时是重复020的$a子字段,还是重复020字段。报道没有说明讨论的具体内容,推测重复子字段的理由应当是,因为对应的是同一装祯形式的多个号码;重复字段的理由应当是MARC 21定义中020$a不可重复。考虑到多家图书馆管理系统实现上的问题,LC最终采用重复020字段的方法。著录顺序是13位的在前,10位的在后。OCLC由于系统原因,暂时采用024字段(其它标准号),而未来仍将采用020字段。


    CNMARC方面,国家图书馆编《新版中国机读目录格式使用手册》(北京图书馆出版社,2004年)采用新的073字段(国际论文号)著录ISBN-13(第46页)。这就意味着未来的”国际标准书号”将不著录在国际标准书号(020)字段中,而著录在国际论文号(073)字段中。国家图书馆在编手册时(2003年上半年)就了解到了”ISBN书号谋划升位“之事,仍做出这种规定有点不可思议。

    编目员更关心对自己工作的影响。其实ISBN-13就号码而言,目前与ISBN的差别只是在ISBN前加上978,以及最后1位校验位不同。校验位本来就是由机器自动生成,所以著录时没有理由让编目员输入两次,而应当由软件自动由10位的ISBN转换成ISBN-13,或者反之。OCLC目前在下载记录时,会自动把以978开头的ISBN-13转换为10位数字的ISBN。
    国内CALIS联合目录也在考虑更新相关软件,以能够顺利处理13位的ISBN号。目前各图书馆自动化管理系统的编目模块,编目时会进行ISBN号码自动校验,ISBN-13会被视为错误的ISBN而作出提示或自动改为$z子字段。不知道各图书馆自动化管理系统对此准备得如何?

更新(2005年5月24日):
    不列颠图书馆同样于2004年10月1日起处理ISBN-13。见:The British Library and 13-digit ISBNs

 

解读OCLC编目服务的霸王条款

    OCLC宣布将于2005年7月1日起改变其编目服务的收费方式,由可选择每次检索收费全部改为年费制,年费由本馆估计的下载记录数量决定。同时大幅度提高收费标准,由每次检索1.1/1.3美元提高到每记录2.2/2.5美元(原来年费是每记录1.7/2.0美元)。并且最低年费定为3000美元,需预付!
    如果实际使用量超出估计数量20%或以上,OCLC将”保留重新商讨价格或终止服务的权利”。如果图书馆实际超出量在20%以内,OCLC不会要求支付额外的费用。但”图书馆在任何情况下,都不能向OCLC要求退还编目年费。记住,是你们自己作出最初估算的。”
    OCLC将考虑图书馆的实际使用情况,设定下年的编目年费。”如果图书馆实际使用在20%的范围以内,下年编目年费应当增长5%以补偿通胀费用“。
    向OCLC贡献记录有收益。所有新书都采用WorldCat编目的成员馆(Governing Member)每条3美元,其它成员馆分文没有――真的是作贡献。成员馆所得收益只能用于抵扣本馆下年的部分编目年费。而且”每年的最大收益额不能超出图书馆当年预付给OCLC的编目年费“――只进不出。

    另外,Open WorldCat成了OCLC的新卖点,看来向搜索引擎提供书目数据对图书馆利用已经产生了不错的影响。要加入Open WorldCat项目,在Google或Yahoo中检索出图书时通过图书馆搜索链接到本馆,需满足以下三个条件:
1、必须是Governing Member。全部新书记录采用WorldCat本身就意味着巨大的支出。
2、必须将图书馆所有馆藏批上载到WorldCat。每条记录收取处理费20美分!”如果馆藏很大,这笔费用很大,但是,这是一次性投资”。既然如此体恤图书馆,为什么即使是OCLC没有的记录,OCLC也不抵扣馆藏处理费呢?因为”你们难道不同意,天下没有免费的午餐(good things do not come free)”?
3、图书馆必须订购FirstSearch WorldCat。”最小订购费:一个并发用户,每年4500美元。如果是大馆,需要一个以上同时登录用户。”

更新及修改(2005/2/27)  
    CALIS与OCLC订有协议,凡CALIS成员馆套录OCLC记录,除成员馆支付费用外,CALIS也需向OCLC支付费用,因为成员馆提交给CALIS的记录是给所有成员共享的。CALIS因此要求各馆下载OCLC记录后,必须提交给CALIS。
    我没有见到过协议文本,直觉的理解是OCLC按各馆下载记录条数计费,而不是去掉重复记录后的种数;CALIS要求下载OCLC记录后必须提交,目的在于防止各馆重复到OCLC下载同一条记录。果真如此的话,那么假如Governing成员馆依照与OCLC的协议,每条记录都套录OCLC记录以提供馆藏,那么势必造成CALIS重复为同一条记录付费。从本馆统计数据看,新编图书中CALIS已有记录所占比例在1/3到2/3之间。身为Governing成员的大馆如果也是此一比例,这部分记录的绝对数绝非小数字。另一方面,CALIS还将为Governing成员馆从OCLC下载的CALIS已有记录付费。两者相加,CALIS蒙受的损失将是巨大的。
    如果我对CALIS/OCLC协议的理解没错,那么看来CALIS需要重新与OCLC商议相互之间的协议了。

附件 Cataloging Servcie & Open WorldCat 2005.pdf:http://blog.blogchina.com/upload/2005-02-27/20050227075114310144.pdf