OCLC推出实验分类服务Classify

    OCLC前些日子刚推出了针对LCSH、MeSH、TGM(图形资料叙词表)等的控制词表术语服务(Terminology Services),接着又推出了实验性分类服务(An experimental classification service),这是一项基于WorldCat数据挖掘的原型服务Classify,采用OCLC的FRBR作品集算法,提供作品的DDC、LCC及NLM分类号。
    从Classify检索入口,可以通过ISBN、ISSN、OCLC控制号、UPC(通用产品码)或者作者/题名进行检索。由于很多作品都有不同版本,所以分类号也可能呈现五花八门的情况。
    目前提供的信息有:
基本信息:题名、作者、体裁、版本、收藏馆数
分类信息(DDC、LCC、NLM):最常用分类号及收藏馆数,最新分类号及收藏馆数,最新分类法版本、分类号及收藏馆
分类号分布图:分为所有及DDC、LCC、NLM的分布
版本详细信息,包括题名、作者、语种、收藏馆数、MARC类名、分类号等

    其中最抢眼的是分类号分布图。同一种书,分类号大多数情况下差别不会太大,于是分类号分布饼图一般情况下就象游戏中那个张着大嘴吃豆子的小家伙。下面特意找了个有很多不同分类号的例子截图

    昨天看到时没觉得这个分类服务有什么用,今天看到David说这是个“快速、简单获取分类号的途径,而无须是OCLC成员”,方才想到原来WorldCat是不显示分类号的。David在一个专业馆工作,在美国很多小馆无钱参加OCLC,而查LC的命中率又不够高,如同我当初,千方百计、削尖脑袋找免费的数据来源。
    Classify提供最新分类号、分类法版本也是挺有用的,因为有可能反映了分类法的更新,常常新分类号更接近最新理解。看了几个例子,或许都不是医学方面的,没有见到NLM号。

   不管“有用”、“没用”,可以看到OCLC在如Lorcan Dempsey所说的那样,不断地"make data work hard"。难怪OCLC尽管属于图书馆行业,却已连续三年名列《计算机世界》最佳IT工作单位(Computerworld’s Best Places to Work in IT),并且排名从2007的第86位上升到了2008的第51位。

   另:在WorldCat.org查上图中的书“Stilwell and the American experience in China, 1911-45”,共14条,而且首条只显示10版本(而不是上图的15),可见WorldCat.org“版本”部分的FRBR化做得还不到家──10版本中没有包括检出的几个中文译本,即《史迪威与美国在中国的经验》《史迪威与美国在华经验》《蔣介石的外國高級參謀長 史迪威》。

参见:
Class numbers on works (July 09, 2008) from Lorcan Dempsey’s weblog
Classify from OCLC (July 10, 2008) from Catalogablog

OCLC的新一代编目产品

    OCLC副总裁Lorcan Dempsey是LC书目控制未来工作组成员,但在工作组长达一年多的活动期间,他几乎没有在自己博客上谈论过小组内情。即使在报告发布以后,好象他也没有在博客上发表过自己的意见,印象中只提供过一个OCLC对报告意见的链接。但在小组的报告草案于2007-11-30发布不久,OCLC立刻在网站上挂出了一个名为“新一代编目”(Next Generation Cataloging)的试验计划(DC.Date.Created=2007-12-11),其中引用了报告草案的建议。
    这个新一代编目试点项目,就是抓取来自出版社的ONIX数据并对质量加以强化,以及早加入WorldCat。显然项目的结果是,OCLC将由用户贡献数据的分销商转而成为原始数据供应商──OCLC将此项目归在试验中的产品(ProductWorks),顺便可以看看OCLC琳琅满目的试验中产品。
    项目运作过程:
· 合作出版社/供应商(Ingram图书集团、Hachette图书集团、普林斯顿大学出版社、Taylor and Francis)提供ONIX格式的信息。OCLC将数据转换为MARC格式加入WorldCat,并尽可能通过数据挖掘与数据映射的方式自动强化数据。强化后的元数据以ONIX格式返回给出版社/供应商,以对OCLC的强化作出评估。
· 合作图书馆(芝加哥公共图书馆、凤凰城公共图书馆、MIT图书馆、俄亥俄州立大学图书馆)评价通过上述过程加入到WorldCat中元数据的质量,反馈其用于图书馆技术服务流程的适应性。

    据OCLC负责WorldCat与元数据服务的副总裁Karen Calhoun在不久前举行的“编目未来”会议(The Future of Cataloging: a PALINET Symposium, 29 May 2008)所作主旨发言“转变之旅:从苟延残喘到蓬勃发展”(Traveling Through Transitions: From Surviving to Thriving,PPT),试验计划将于本月结束,目标是在2009财政年度正式发布(p.46)。

    在即将举行的ALA的2008年会上,6月29日将会有一场名为“OCLC编目新方向”(New Directions in Cataloging at OCLC)的专场,介绍新一代编目项目的试验结果。再顺便看一看OCLC在年会上排得满满的四天活动日程,Big O真是牛得让人无话可说。

Our Space──OCLC总裁在上海图书馆的报告

    今天到上海图书馆参加学会的双月学术讲座。报告人OCLC总裁Jay Jordan本是大腕,现场人却不多,颇感意外。也因为到了预定开始时间人还是不多,所以主办方特意留些等候时间,介绍与会者。
    汗颜的是本人也在被提及者之列,并被点名与Jordan做些交流。更汗颜的是,吴建中馆长说他也没有见过本人,让1/4世纪前就因听吴馆长唱《姿三四郎》主题曲而成为其粉丝的本人大为吃惊(其实也没什么好吃惊的,就好象我在十多年前认识HJT,而他根本连我的存在都不知道一样)。一向自闭而羞于见人的本人,在此情况下手足无措,断不敢前往……

    言归正传。Jordan报告题为“Our Space”,言题目由Myspace联想得来。(他称自己的报告是My remark today …,不知是否谦辞?)[update 2008-6-20: PPT下载]
    报告以两幅流行的互联网图开始,指出图书馆所处不利形势。在举出OCLC近年的三个成员报告后,披露下周将有第四个报告问世。
    报告提到OCLC的2000年策略规划,其中有Web Scale,足以令人佩服OCLC的前瞻。刚刚上OCLC网站上查这个Strategic Plan原本,大概因为太早没有上网。查到2004年5月Jordan在成员理事会上的报告PPT,同样提到2000年的这个规划,只有三条,并未提及Web云云──也能与时俱进啊。
    印象特别深的是报告最后展望OCLC的合作空间,特别提到档案馆和博物馆,看来OCLC要向图书馆界之外拓展空间了。

    最后提问时一位华东师大的研究生MM问及图书馆提供免费服务,为什么OCLC要收费。Jordan指出OCLC有很多是免费的,比如成员报告、WorldCat系列,并且OCLC将遵从潮流,提供更多免费的服务。同时指出OCLC有1300员工,只有收费才能维持发展。担任翻译的OCLC副总裁、亚太区王行仁主任说,图书馆由政府资助,但并没有哪个政府给OCLC提供资助。听着很有道理吧──不过,为什么连老美都觉得太贵呢!

    报告全面宣传OCLC近十年来的众多产品,这里把讲述中着重强调的几个录于下:
WebJunction
CONTENTdm(数字图书馆软件):提问阶段上图一位做历史文献数字化的MM问及,Jordan坦言其至今仍不兼容unicode,但9月以后将支持unicode
NetLibrary:称西文电子书老大,但与万方、超星无法比
WorldCat Collection Analysis:不同图书馆馆藏分析比较 [显然,不把书目提交给OCLC则无法做]
WorldCat Registry:希望成为全世界图书馆信息大全,免费注册提交
QuestionPoint(联合虚拟参考咨询):2002年LC提出设想,目前有23个国家1900个图书馆参与,到2007/11已提交3百万个问题,全球知识库已有Q&A记录17,000条
WorldCat
    2008/4/1书目记录达到1亿条
    在Top 10原编馆中,港大名列第2,中文大学名列第10
    国家图书馆批量加入计划(National files pending for WorldCat),国图数月前已将150万中文记录交于OCLC,大英图书馆也将在年内加入2千万期刊文章
    多语种:非英语记录已由1998年的36%升至2008年的50.1/4%,超过一半
    下一代编目服务试验计划(Next Generation Cataloging Services Pilot):举书目控制未来工作小组报告“On the Record”,指出OCLC正做抓取ONIX元数据的工作。
    提问阶段提到最近宣布的OCLC与Google图书的合作计划
WorldCat Identities
WorldCat Lists [会成为LibraryThing的竞争者吗?]
WorldCat Facebook Widget:去年报告研究隐私,就是由于社会网络的发展
WorldCat API
WorldCat Local Pilot:去年5月华盛顿大学开始合作计划。7-12月半年的统计数据对比(2006/2007):向所属联盟借入上升70%,通过WorldCat的馆际互借上升100%。
[此数据足以说明一次检索多方资源的重要性。可以有两方面的联想,一方面,未来图书馆界对书目数据质量不会怎么在乎,因而未来国内联合目录间竞争的不是书目数据,而是馆藏数据;另一方面,像WorldCat Local那样的基于联合目录的OPAC前端或许有很多缺点,但因满足用户一站式搜索的期望,一俊或可遮百丑]

附:以前没有特别留意过WebJunction,OCLC网站上对WebJunction的介绍:一个基于Web的社区,帮助图书馆满足其技术与培训需求,免费注册。2002年由比尔和美林达·盖茨基金会资助OCLC建立。
WebJunction:图书馆员的联机社区
曾经看过keven收藏的该网站上的几篇维基文章(建立维基前需要考虑的问题(2006-07-18))

关于WorldCat API:网页2008/5/27刚发布,还在邀请测试阶段。今后非成员如何利用尚未确定。

关于OCLC的成员报告(Membership Reports):
即将发布:From Awareness to Funding: A study of library support in America      

三个全球范围的调查报告:
2003:Environmental Scan: Pattern Recognition  (有清华大学中译本)
2005:Perceptions of Libraries and Information Resources 
    图林中文译站:《图书馆与信息资源的理解:给oclc成员的报告》之结论部分 (2005-12-21) (镜像)
2007:Sharing, Privacy and Trust in Our Networked World 
   有《数字图书馆论坛》中译本(2008年第3期
参见:
OCLC成员报告“网络世界中分享、隐私与信任”:有趣的数字 (2007-10-29)
OCLC成员报告之美国“图书馆与信息技术”大事记 (2007-10-29)

其它参见:
OCLC的Open WorldCat计划 (2004-10-28)
维基版的OPAC什么样? (2005-10-08)
OCLC联合目录WorldCat全公开 (2006-08-10)

规范档2.0:WorldCat身份档 (2007-02-14)
OCLC的新副总裁:Karen
Calhoun
(2007-03-27)
WorldCat Local:取代本地OPAC?(2007-04-16)

WorldCat的Facebook应用 (2008-01-04)

[update: 2008-6-17] 照片请看大旗底下:“Our Space”在哪里

[update: 2008-6-20] 上海图书馆学会报道:OCLC总裁访问上海图书馆并做专题演讲(含照片及PPT下载链接)

[update: 2008-6-19] 牛排对OCLC的认识让人无话可说:Beefsteak is thinging: 从LAM到OCLC