OCLC2008/2009年度报告数据解读

    OCLC2008/2009年度报告发布(62页PDF),时间段应该是2008/7-2009/6。有些数据以前也听说或知道些,比如WorldCat的中文数据已经超过日文,位居第5(国图的加入巩固了这个地位);香港大学原编数量第一,本年度增加82,585条(真不知道该馆有多少编目员)。有些数据则是第一次感受到。

    OCLC参与馆已达72,035家,比上年度又增加了二千多家。原来印象中不过二三万,没想到有这么多,巨无霸,无人能比。

    印刷目录卡片订购量160万张,虽然比上年度的180万张有所减少,仍是一个意想不到的数字。不知道发行到哪些地区,能够消费得起OCLC服务的,也不至于太穷,只能说明世界上还有不少图书馆仍在使用目录卡片,难怪LibraryThing的图书馆编目快闪族在美国还有市场,做了一次又一次。

    处理的馆际互借数量1.03千万,比上年度略增。可见电子资源虽然飞速发展,对实体文献的需求仍很旺盛

    QuestionPoint的数字看不太懂。使用图书馆2200家,不增不减,但国家从23个增加到了28个。自2002年6月(服务开通)以来的提问数,上年度总计360万,本年度460万,计算结果是增加100万,但本年度提问只有43万多(比上年的近60万减了不少),还有57万?想着是不是大家都去用meebo做在线咨询而弃用QP了,但聊天次数却有56.7万,比上年度的48.8万增加不少。做一下除法,上年度每次聊天问1.15个问题,本年度问0.76个问题──不咨询问题,难道真用QP聊天?

    本年度批载入数据达2.418亿,上年度也有2.121亿,再之前是1.397亿(首次过亿),OCLC攻城掠地的速度真是惊人。本年度批载入书目数据超过百万的有56个机构,第1位是近4250万条记录的GBV(应该是德国最大的图书馆联合目录吧,它的Z39.50服务器是套录德国数据的最佳来源),中国国家图书馆224万居第26位。
    除了新西兰、澳大利亚、以色列等国家图书馆,特别引人注目的是其中那些著名大学:康奈尔、哈佛、加州多个分校、密歇根、斯坦福、剑桥、宾州、麦吉尔、芝加哥等。这些馆应该早就是OCLC的贡献成员馆,此举意味着他们把所有馆藏全都交到了WorldCat,接下来使用OCLC的WorldCat Local升级版──Web级管理服务也就水到渠成了。云计算集成管理系统真的要从小型图书馆走向大型图书馆了

    自2005年WorldCat.org上线以来,为WC带来流量的前10个网站中有2个来自中国,分别是第9位的百度(28.44万)和第10位的读书(23.75)。自己很少读书,以前不知道有读书网,惭愧!

    最后部分是财务数据,看不懂。似乎本年度OCLC在不少方面都亏了钱,而以前基本都是赚的
    除了数据,报告中还有更多OCLC产品介绍,就不一一提及了。或许不久之后,OCLC北京代表处就会有中译本提供。

Via ResourceShelf: OCLC Publishes 2008-2009 Annual Report (December 9th, 2009)

[update] 刚看到Nalsi的西文编目笔记 II,从另一个角度介绍这个报告:OCLC 08-09年度报告


关于OCLC的Web-scale management services,参见:
网络级编目/Web范围编目 (2008-01-31)
OCLC的云计算图书馆自动化系统 (2009-04-27)

另参见:图书馆编目快闪族 (2009-03-09)

WorldCat书目记录2009统计分析

    OCLC首席科学家Thomas Hickey在博客上发布了2009年10月1日的WorldCat书目记录统计(Bibliographic Statistics 2009,无轻功免点),2007年3月他也做过同样的统计。
    在这二年半中,WorldCat书目记录从0.83亿条飞升到近1.46亿条(不包括worldcat.org所含文摘索引数据库中的记录),增加了80%。如此发展,当然不是靠人一条条做进去的。近年WorldCat批量加入了很多国家图书馆
(包括中国国家图书馆)与大型书目库的记录,今天还看到”Credo Reference is adding MARC records to WorldCat“,一加就是300多万条,当然不全部是新增,其中一些WorldCat中已有的,只是在记录中加一个可检索的来源标记。
    与之相比,馆藏从11.2亿增长至14.7亿,3.5亿也是一个惊人的数字。

    特别有意思的另两组数字:MARC平均记录长度从803字节下降到785字节,每记录字段数从15.4个下降到14.9个。恐怕大多数人看到这两组对比数字,都会想到这体现了书目的简化趋势。或许Hickey当初也是这么想的,但他还提供了另一组数字:不同的MARC子字段数从1670上升为3278,几乎番翻。Hickey认为,虽然增加了6300万条记录,也不至于会有这个结果。想来原因正是很多非美国编目记录的加入,或许原来所用MARC子字段与MARC21不尽相同,或许原来用UNIMARC家族的,转换为MARC21后对应到非常用的MARC21子字段。
    在关于MARC的争论中,曾经有一点是MARC有那么多字段、子字段没什么人用。WorldCat的这个统计或许说明,如果放大到全球,那么使用的子字段或许更多些。放着不用或没有用,总强过要用而无可用──这是编目员在分类或编目时经常头痛的事。

    由于今日失却最后的上网护身符洋葱头(Tor),武功尽失。今做托钵僧,乞轻功高手下载WorldCat2009年统计数据表(Bibstats2009)后赠予本人。阿弥陀佛,善哉善哉!

第三届OCLC软件竞赛结果

    OCLC在2005年和2006年接连举办了两届软件竞赛,事隔三年,有了第三届,其目标仍为鼓励对OCLC的Web服务的创新应用。结果日前公布,来自加州州立大学的David Walker以名为Bridge的应用获奖:一套提供可配置和可定制的WorldCat全记录显示服务,向各图书馆提供了在自己所需位置定制WorldCat全记录显示的能力。换言之,可以用其代码,将WorldCat检索结果嵌入到本馆OPAC及其他需要的地方。
    从显示实例Java in a Nutshell: A Desktop Quick Reference看,融合了WorldCat的封面,OCLC的FRBR化xISBN,通过Z39.50检索OPAC方式获取本地馆藏(洛杉矶及加州州立大学各馆)。
    项目的源代码在Google Code上公开。按评委Roy Tennant的说法,代码用PHP写成,本地配置只需编辑一个简单的XML文件,再加一些图、做点样式转换(XSLT和CSS),就可以搞定了。

    题外话:看到获奖者与评委在图书馆中的职位,真正是紧跟形势,体现Web服务在图书馆计算机应用中的位置:获奖者David Walker是Library Web Services Manager;唯一一个来自图书馆的评委Kevin Clarke是Coordinator of Web Services,来自阿巴拉契亚大学的Belk Library and Information Commons──图书馆名称竟然已经加上了信息共享空间。

参见:
OCLC Announcements (22 July 2009). David Walker Wins Third OCLC Research Software Contest
OCLC Developer Network Blog: Congratulations to David Walker / by Roy Tennant

项目主页
Bridge: WorldCat in Context
源代码
bridge-worldcat: A configurable and customizable view of worldcat services

关于OCLC软件竞赛:
OCLC软件竞赛 (2005-02-05)
OCLC软件竞赛结果 (2005-06-25)
第二届OCLC软件竞赛 (2006-07-07)
第二届OCLC软件竞赛结果 (2006-09-30)