OCLC推出实验分类服务Classify

    OCLC前些日子刚推出了针对LCSH、MeSH、TGM(图形资料叙词表)等的控制词表术语服务(Terminology Services),接着又推出了实验性分类服务(An experimental classification service),这是一项基于WorldCat数据挖掘的原型服务Classify,采用OCLC的FRBR作品集算法,提供作品的DDC、LCC及NLM分类号。
    从Classify检索入口,可以通过ISBN、ISSN、OCLC控制号、UPC(通用产品码)或者作者/题名进行检索。由于很多作品都有不同版本,所以分类号也可能呈现五花八门的情况。
    目前提供的信息有:
基本信息:题名、作者、体裁、版本、收藏馆数
分类信息(DDC、LCC、NLM):最常用分类号及收藏馆数,最新分类号及收藏馆数,最新分类法版本、分类号及收藏馆
分类号分布图:分为所有及DDC、LCC、NLM的分布
版本详细信息,包括题名、作者、语种、收藏馆数、MARC类名、分类号等

    其中最抢眼的是分类号分布图。同一种书,分类号大多数情况下差别不会太大,于是分类号分布饼图一般情况下就象游戏中那个张着大嘴吃豆子的小家伙。下面特意找了个有很多不同分类号的例子截图

    昨天看到时没觉得这个分类服务有什么用,今天看到David说这是个“快速、简单获取分类号的途径,而无须是OCLC成员”,方才想到原来WorldCat是不显示分类号的。David在一个专业馆工作,在美国很多小馆无钱参加OCLC,而查LC的命中率又不够高,如同我当初,千方百计、削尖脑袋找免费的数据来源。
    Classify提供最新分类号、分类法版本也是挺有用的,因为有可能反映了分类法的更新,常常新分类号更接近最新理解。看了几个例子,或许都不是医学方面的,没有见到NLM号。

   不管“有用”、“没用”,可以看到OCLC在如Lorcan Dempsey所说的那样,不断地"make data work hard"。难怪OCLC尽管属于图书馆行业,却已连续三年名列《计算机世界》最佳IT工作单位(Computerworld’s Best Places to Work in IT),并且排名从2007的第86位上升到了2008的第51位。

   另:在WorldCat.org查上图中的书“Stilwell and the American experience in China, 1911-45”,共14条,而且首条只显示10版本(而不是上图的15),可见WorldCat.org“版本”部分的FRBR化做得还不到家──10版本中没有包括检出的几个中文译本,即《史迪威与美国在中国的经验》《史迪威与美国在华经验》《蔣介石的外國高級參謀長 史迪威》。

参见:
Class numbers on works (July 09, 2008) from Lorcan Dempsey’s weblog
Classify from OCLC (July 10, 2008) from Catalogablog

《OCLC推出实验分类服务Classify》上有7条评论

  1. 您好,看了您关于marc介绍的文章,我真是受益良多,我本身也是做西文编目的,但也只是刚刚入行,我主要是用西文的编目规则做中文学术类的图书,因为没有系统的学过西文编目,所以只是自学的知识了一些皮毛,但对于图外图书馆的主题关键词和分类就无从入手了,还望您以后能多发表一些关于此类的信息,和途径。十分感激!

  2. 燃眉之急^
    是这样的,有一家国外的图书馆,我现在在给他做marc,它们馆用的是UTF-8编码,我用的软件是冠景的编目软件,导出数据时也是用的UTF-8的编码,而且,也有几家图书已经有业务来往了,但此家图书馆回复说其它字段没有问题,只有显示汉字的字段乱码。请问您问题究竟出在了哪里呀?如能赐教,不胜感激!!!
    博主 对 陈雪飞 的回复: 2008-08-07 20:45:07
    主题词一般用LCSH的比较多,如果没有印刷版的,可以用LC的规范档,选择主题途径查就可以了(authorities.loc.gov)。分类法一般会是DDC,没有印刷版的话,网上也没有免费的电子详版。只能参照类似图书给号。
    对MARC的编码不了解,只知道在头标中有一个字符位是表示编码的。我想这个问题还是应该问冠景公司。

  3. 您好,收到您的回信,十分感激,我是这一行的新手,以后如遇到问题还希望能够得到您的指教,也希望不会给您带来太多的麻烦,先再此谢过!

  4. 关于编码的事谊我已请冠景的老师测试了,结果有待证实,另外我还有一事请教您,是这样的,我们是一家图书出版公司,现正在筹措给图书馆做西文编目,并也有了一定的客户源,但因西文数据中的关键词和分类比较难给,并且也没有工具书,因此冒昧的问您一句,可否请您有偿的给我司制作full-marc,或者您给把把关也行?不过您也知道现在图书馆加工marc数据已开始竞争了,而且非常的激烈,我们不仅想在质量上也想在价格上都具有竞争实力。如果能有您的指导和帮助,那我们就更有信心和把握了!
    博主 对 陈雪飞 的回复: 2008-08-11 16:52:53
    争取能早点退休,再加盟贵公司吧:)

  5. 老师,您好!
    我现在正在给一家大学图书馆做US-MARC,但手上缺少《美国国会图书馆标题表》和《美国国会图书馆分类法》。我在亚马逊上看到了这两种书,但是是英文版的,我想请问一下,这两种书是否有中文版或中英文对照的?
    如果有还请您指教!谢谢!

    编目员:陈雪飞


    博主 对 陈雪飞 的回复: 2009-02-25 17:11:25
    很遗憾,都没有。
    前者有四册或五册,后者怕有几十册,即使有人译,也没人出版吧。

  6. 精灵老师,您好!
    我想问一下050字段中$b子字段后的“句点”有和没有,有什么区别吗,这个“句点”有什么特殊的作用吗?
    例如:050$aB127.C65$b.Z435 2007
    050$aLA1131.8$bM526 2008

    博主 对 cicyone 的回复: 2009-05-09 14:50:43
    偶不知.不过,您也不该用错误的例子来误导偶呀.

    据偶到LC目录浏览观察,索书号第一次分段时有一个点,第二次就不加了.也就是说,分类法本身有分段时,著者号前就不加点了.

    如此推测,您所给的两个例子或为:

    050$aB127.C65$bZ435 2007

    050$aLA1131.8$b.M526 2008

评论已关闭。