中国分类主题词表Web版试用记

[update 2010-04-04: 标题原误作“中国汉语主题词表……”,现改]

月初时看书蠹精博文“国家图书馆召开2010年全馆员工大会”(2010-03-02),提到中文采编部的“《中国分类主题词表》Web版”项目获得了创新奖,发现自己对这个Web版一无所知,就去中图法编委会网站(http://clc.nlc.gov.cn/)找,链过去发现已经错过了试用期。[update 2010-04-04: 今天无意中发现,实际上在2009-06-03曾注册试用,不知为何既未在头脑中留下记忆,也未在本博留下记录?]

昨日未看到书蠹精新博文“《中国分类主题词表》Web版正式发布的通知”(2010-03-23)。今天由CALIS得知《中国分类主题词表》Web版(http://cct.nlc.gov.cn)再度试用,访问首页发现系统测试期已延长至2010年6月15日。先行试过的同事说网上注册用户只能看到若干级[update 2010-3-28: 据书蠹精博文“《中国分类主题词表》Web版正式发布后的反响”(2010-03-25),需等待批准后可有全功能],而注明国家图书馆网络用户的登录名nlcuser则是全功能的。用nlcuser登录后,在个人管理中看到该帐号有效期至2013-02-01,不知道6月15日后此登录名是否只限国图局域网访问。[update 2010-3-25: 现已提示“帐号仅限内部使用”]

使用的感觉与几年前用的光盘版几乎相同。左上部(设为A区)为分类主题对应表的树状浏览;右上部(设为B区)为主题分类对应表,可点击首字母浏览。点击某类号或某主题词,左下部(设为C区)为分类法类目详细信息,右下部(设为D区)为主题词等级显示,ABCD四区同步更新。
除浏览外,可选择分类或主题的各个部分,进行任意一致、完全一致、前方一致、后方一致的检索。
发现分类号与主题词均有“记录控制号”,似乎以前未在光盘版中见过。

在“个人管理”中有“OPAC管理”与“评注管理”。记得光盘版安装后是可以加评注的,但与OPAC关联却是首见,也可以说是Web版的亮点。
试着增加本馆OPAC,然后测试在分类号与主题词上按右键,直接检索,效果不错。但设置过程比较痛苦,因为帮助中没有详细说明,是反复试后悟出来的,可能有错:
一、系统根据“OPAC名称”中的“分类”或“主题”字样,在分类号或主题词上按右键时会弹出相应的目录。即在“OPAC名称”中必须有“分类”或“主题”,否则设置无效。
二、只有列入“首选OPAC”,才能在右键链接中出现。尽管可以把所有OPAC都加入“首选OPAC”,但右键可弹出的OPAC链接数量有限(试下来有时2个分类、3个主题,有时相反)。需要修改“排序号”,保证自己需要的OPAC能出现。新加入“首选OPAC”的均为0,自己最希望用的OPAC设为1比较保险(分类、主题可分别设1),3以下的基本不可能出现了(除非1、2没有)。
三、IE only,用Firefox及Chrome不支持右键菜单。
在增加本馆OPAC前后,看到北师大OPAC正好先于自己加入。所幸这位同仁没有像我这样折腾,要不然两人用同一个帐户改设置,恐怕永远试不出结果了。

在“个人管理”中可填写“下载数据库申请表”,经审查同意、签署协议后可获取数据。数据包括《中图法》与主题词表,数据格式有MARC、XML及“其他”可选,用途有“用于应用系统”、“用于再编表”、“用于研究试验”及“其他”可选。

最后指出一点瑕疵,“个人管理”页面下部显示:Copyright (c) 2008 Corporation,哪个公司做的?

OCLC推出实验分类服务Classify

    OCLC前些日子刚推出了针对LCSH、MeSH、TGM(图形资料叙词表)等的控制词表术语服务(Terminology Services),接着又推出了实验性分类服务(An experimental classification service),这是一项基于WorldCat数据挖掘的原型服务Classify,采用OCLC的FRBR作品集算法,提供作品的DDC、LCC及NLM分类号。
    从Classify检索入口,可以通过ISBN、ISSN、OCLC控制号、UPC(通用产品码)或者作者/题名进行检索。由于很多作品都有不同版本,所以分类号也可能呈现五花八门的情况。
    目前提供的信息有:
基本信息:题名、作者、体裁、版本、收藏馆数
分类信息(DDC、LCC、NLM):最常用分类号及收藏馆数,最新分类号及收藏馆数,最新分类法版本、分类号及收藏馆
分类号分布图:分为所有及DDC、LCC、NLM的分布
版本详细信息,包括题名、作者、语种、收藏馆数、MARC类名、分类号等

    其中最抢眼的是分类号分布图。同一种书,分类号大多数情况下差别不会太大,于是分类号分布饼图一般情况下就象游戏中那个张着大嘴吃豆子的小家伙。下面特意找了个有很多不同分类号的例子截图

    昨天看到时没觉得这个分类服务有什么用,今天看到David说这是个“快速、简单获取分类号的途径,而无须是OCLC成员”,方才想到原来WorldCat是不显示分类号的。David在一个专业馆工作,在美国很多小馆无钱参加OCLC,而查LC的命中率又不够高,如同我当初,千方百计、削尖脑袋找免费的数据来源。
    Classify提供最新分类号、分类法版本也是挺有用的,因为有可能反映了分类法的更新,常常新分类号更接近最新理解。看了几个例子,或许都不是医学方面的,没有见到NLM号。

   不管“有用”、“没用”,可以看到OCLC在如Lorcan Dempsey所说的那样,不断地"make data work hard"。难怪OCLC尽管属于图书馆行业,却已连续三年名列《计算机世界》最佳IT工作单位(Computerworld’s Best Places to Work in IT),并且排名从2007的第86位上升到了2008的第51位。

   另:在WorldCat.org查上图中的书“Stilwell and the American experience in China, 1911-45”,共14条,而且首条只显示10版本(而不是上图的15),可见WorldCat.org“版本”部分的FRBR化做得还不到家──10版本中没有包括检出的几个中文译本,即《史迪威与美国在中国的经验》《史迪威与美国在华经验》《蔣介石的外國高級參謀長 史迪威》。

参见:
Class numbers on works (July 09, 2008) from Lorcan Dempsey’s weblog
Classify from OCLC (July 10, 2008) from Catalogablog

SKOS:简单知识组织系统

[DIGLIB]2008-2-27消息:
SKOS Primer征求意见(Call for Comments: SKOS Primer: W3C Working Draft 21 February 2008):SKOS Primer 将取代SKOS Core Guide (2 November 2005)。
看SKOS Primer一过,稀里糊涂。收集些SKOS的资料。

SKOS Home(http://www.w3.org/2004/02/skos/
SKOS: Simple Knowledge Organisation Systems

SKOS是一个工作领域,致力于制定规范和标准,支持在语义网(Semantic Web)框架中利用知识组织系统(KOS)如叙词表、分类法、标题表系统和系统分类法。
SKOS提供标准方法、使用RDF表达知识组织系统。

维基百科中的SKOS(http://en.wikipedia.org/wiki/SKOS)[上述官方网站提供的唯一外部链接]

SKOS是设计来表达叙词表、分类法、系统分类法、标题表系统或任何其他种类结构化的受控词表的正式语言家族。SKOS建立在RDF及RDFS基础上,其主要目标是方便为语义网出版受控结构化词表。SKOS目前在W3C框架内制定。

历史
SWAD-Europe (2002-2004)
  欧洲语义网高级开发项目。2003年底SKOS核心与SKOS映射首次出版。
Semantic Web Activity (2004-2005)
  W3C主义网活动。
Current Status and Roadmap (2006-2008)
  SKOS的主要出版文献均处于W3C工作草案状态:
    SKOS Core Guide (2 November 2005)
        [计划由SKOS Primer取代,并与新的SKOS Reference配套]
    SKOS Core Vocabulary Specification
    Quick Guide to Publishing a Thesaurus on the Semantic Web

社区与参与
正式参与:语义网部署工作组(Semantic Web Deployment Working Group)http://www.w3.org/2006/07/SWD/
非正式讨论:public-esw-thes@w3.org邮件组

SKOS组成
SKOS被设计为模块化、可扩展语言家族,其使用与实施应尽可能简单。其组成为SKOS Core, SKOS Mapping, SKOS Extensions。
SKOS核心定义标准叙词表中表达通用特征的类与性能,它基于以概念为中心的词汇观,其原始对象不是术语(词),而是术语所代表的抽象概念。每一概念具有所附的RDF特性,包括:
· 一个或多个优选索引词(每种自然语言最常用)
· 交替词或同义词
· 定义与注释,以其语言的规范
概念可以使用属-分关系以等级方式组织,也可以非等级(相关)关系链接。

应用
AGROVOC与GEMET升级到SKOS格式
SWED环境目录使用SKOS作为叙词表语言
阿姆斯特丹Vrije大学将MeSH转换到SKOS
IBM开发了使用DITA与SKOS的主题分类
GeoNames本体采用SKOS表达地理特性类别(geographical feature types)

工具
· ThManager:Java开源应用
· RDF-OWL编辑器如 Protégé或SWOOP
……

与其他标准的关系
· SKOS与叙词表标准
  SKOS开发有来自RDF及图书馆界专家参与,SKOS拟准许方便迁移由NISO Z39.19-2005和ISO 5964:1985标准定义的叙词表。
· SKOS与其他语义网标准
  本体语言OWL的简化版。