SKOS:简单知识组织系统

[DIGLIB]2008-2-27消息:
SKOS Primer征求意见(Call for Comments: SKOS Primer: W3C Working Draft 21 February 2008):SKOS Primer 将取代SKOS Core Guide (2 November 2005)。
看SKOS Primer一过,稀里糊涂。收集些SKOS的资料。

SKOS Home(http://www.w3.org/2004/02/skos/
SKOS: Simple Knowledge Organisation Systems

SKOS是一个工作领域,致力于制定规范和标准,支持在语义网(Semantic Web)框架中利用知识组织系统(KOS)如叙词表、分类法、标题表系统和系统分类法。
SKOS提供标准方法、使用RDF表达知识组织系统。

维基百科中的SKOS(http://en.wikipedia.org/wiki/SKOS)[上述官方网站提供的唯一外部链接]

SKOS是设计来表达叙词表、分类法、系统分类法、标题表系统或任何其他种类结构化的受控词表的正式语言家族。SKOS建立在RDF及RDFS基础上,其主要目标是方便为语义网出版受控结构化词表。SKOS目前在W3C框架内制定。

历史
SWAD-Europe (2002-2004)
  欧洲语义网高级开发项目。2003年底SKOS核心与SKOS映射首次出版。
Semantic Web Activity (2004-2005)
  W3C主义网活动。
Current Status and Roadmap (2006-2008)
  SKOS的主要出版文献均处于W3C工作草案状态:
    SKOS Core Guide (2 November 2005)
        [计划由SKOS Primer取代,并与新的SKOS Reference配套]
    SKOS Core Vocabulary Specification
    Quick Guide to Publishing a Thesaurus on the Semantic Web

社区与参与
正式参与:语义网部署工作组(Semantic Web Deployment Working Group)http://www.w3.org/2006/07/SWD/
非正式讨论:public-esw-thes@w3.org邮件组

SKOS组成
SKOS被设计为模块化、可扩展语言家族,其使用与实施应尽可能简单。其组成为SKOS Core, SKOS Mapping, SKOS Extensions。
SKOS核心定义标准叙词表中表达通用特征的类与性能,它基于以概念为中心的词汇观,其原始对象不是术语(词),而是术语所代表的抽象概念。每一概念具有所附的RDF特性,包括:
· 一个或多个优选索引词(每种自然语言最常用)
· 交替词或同义词
· 定义与注释,以其语言的规范
概念可以使用属-分关系以等级方式组织,也可以非等级(相关)关系链接。

应用
AGROVOC与GEMET升级到SKOS格式
SWED环境目录使用SKOS作为叙词表语言
阿姆斯特丹Vrije大学将MeSH转换到SKOS
IBM开发了使用DITA与SKOS的主题分类
GeoNames本体采用SKOS表达地理特性类别(geographical feature types)

工具
· ThManager:Java开源应用
· RDF-OWL编辑器如 Protégé或SWOOP
……

与其他标准的关系
· SKOS与叙词表标准
  SKOS开发有来自RDF及图书馆界专家参与,SKOS拟准许方便迁移由NISO Z39.19-2005和ISO 5964:1985标准定义的叙词表。
· SKOS与其他语义网标准
  本体语言OWL的简化版。

WebFeat跨库检索系统

    一直也没有认真关注过跨库检索系统。昨晚看Library Journal的2007年自动化系统市场分析文章"An Industry Redefined"(其实是2006年回顾,2007年的情况大概也要到4月份才能看到了),在文中发现了WebFeat,觉得很陌生,就特别标记下来。正巧今天下午Beefsteak在QQ上问我是不是熟WebFeat,当然不熟啦。然后就听Beefsteak说WebFeat申请了中国专利,大概要进军中国市场,然后群聊起各类联邦搜索引擎(或统一检索平台、跨库检索系统)。
    晚上又看到Beefsteak的博文,再度引起我对WebFeat的兴趣。

    首先发现"An Industry Redefine"早由图林中文译站译成了“重构中的图书馆软件产业”,并在《图书馆杂志》2007年第9期上发表了。关于WebFeat的介绍如下:
“WebFeat既直接为图书馆提供联邦搜索产品,又通过结为合作伙伴的ILS公司销售。这些合作伙伴包括TLC、SirsiDynix、VTLS和 Serials Solutions,以及EBSCO这样的非ILS公司。2006年,WebFeat发布了新版的系列产品以增强吸引力。WebFeat Express是新版软件的衍生性产品,能够更加为小型图书馆所承受;WebFeat的企业版开发了客户化功能以及单个图书馆不同配置(profiling)功能以满足图书馆网或图书馆联盟的应用需求。WebFeat作为联邦搜索领域翘楚,其产品拥有5000多家图书馆用户。”

    然后是飞虹一年前写的“webfeat express 2.0新功能”:
“webfeat的技术来自于自身的研发,应该说在目前的三个跨库检索软件中(webfeat、MetaLib和Muse)中独具特色,很有竞争力。”

    在我的Google Reader收藏中,WebFeat标签在去年用过一次,是Library Technology Guides报道纽约公共图书馆采用WebFeat做跨库检索工具(WebFeat system for cross–database searching launched at The New York Public Library):
通过WebFeat系统,NYPL用户可同时检索近400个电子资源、该馆网站、两个OPAC,以及NYPL数字画廊(取自该馆研究馆藏的超过55万张图片)、NYPL联机图片馆藏(超过3万张公共领域的图片)。

    看完上述资料,不由不对WebFeat兴趣大增,便直上网站(http://www.webfeat.org/)。首页介绍:“WebFeat被用于超过16500个公共、学术与政府机构,及全球1000图书馆与信息中心──包括美国100个最大公共图书馆中的1/3、17个州立图书馆、1/5研究图书馆协会馆。”

看WebFeat Express特点
· 兼容:兼容所有可检数据库,专利技术支持超过6000个数据库,而不是仅20%支持API与Z39.50的数据库 [暗指某些系统有此问题]
· 配置简单:使用其Administrative Console,快速方便无争议(no-hassle)
· 定制、品牌、快速搜索框:易于通过选择,定制与图书馆形象匹配的用户界面;快速搜索框可嵌入任何图书馆网页
· 菜单管理(Menu Manager™):集成电子资源与供应商管理。易于由Administrative Console建立数据库表、主题类别、管理访问、追踪订购权限 [ERM?一个顶俩?]
· 无技术依赖:自有专利联邦检索技术,不依赖第三方
· 真正的原始结果:在原有界面中提供全文结果,保留所有原有功能,在原有界面中发邮件、打印、限定检索……只有WebFeat能对所有资源做到此点
· 论题分簇及动态结果排序:可根据不同排序选项(相关性、日期、题名、作者、出版者……)随时改变结果……没有人提供更多的选项
· 拼写检查与词表:与专业词典集成拼写检查,选择装入词表,方便用户在限定检索时选择
· OpenURL:兼容所有主要OpenURL链接解析器,OpenURL链接可嵌入结果引文,方便用户通过鼠标点击找到电子文章。
· 兼容Refworks®, ProCite® and EndNote®:可以不同格式保存结果,输出到书目管理工具如ProCite, EndNote and Refworks!
· SMART使用跟踪:与第二代使用追踪器(选项)合用,能够有效地生成丰富的数据库本馆使用信息
· EBSCO A to Z®集成 [本来EBSCO就采用其技术]
· 多语言支持:九种语言,包括英、汉、法、德、意、日、韩、西。用户可动态改变检索与结果界面的显示语言 [不但支持,而且动态,现在似乎比较普遍了?]
· AquaBrowser Library®集成:与流行的AquaBrowser可视分面检索工具组合
· WebFeat代理:为原始链接提供一站式远程用户认证,可以从WebFeat用户界面直接链接到原始数据库
· WebFeat API:用于开发自己定制的WebFeat应用

    与之相配套的是价格,完全是电视直销中的用语:“一年仅需$7,950,可用至50个数据库,更多每个$85;只需$2,000,就可增加我们的SMART使用追踪”。(所以是“更加为小型图书馆所承受”?)

    最有意思的是,还有30天试用,不是demo数据,而是可以用本馆自己的数据库、OPAC、远程用户认证乃至链接解析器来定制的实际体验版。
    这么有意思,便点击了那个Free Trial,出现的是中文版的说明:
“您马上就可以尽情体验 WebFeat Express 2.0 了!
填写完成此注册表后,将为您的图书馆自动生成WebFeat Express 系统的试用。 随后您将会收到一封包含有登录和配置说明的电子邮件。
我们建议您登记参加一次我们的网上技术交流会,以便了解如何使您试用的 WebFeat Express 系统发挥最大效用。在该网上技术交流会上,我们将向您展示如何使用我们全新用户界面上的定制工具定制您的系统。我们还会展示如何定制您的数据库菜单和主题类别、配置您的目录、从 EBSCO A-to-Z 服务导入输入,以及使用您喜爱的链接解析器增添结果引用。此外,我们还将展示其它图书馆使用这一杰出搜索工具的案例。
您必须是图书馆工作人员才能试用 WebFeat Express。您的试用系统必须与您图书馆中的全体员工共享。”

    忍住了没有注册,要有责任感不是么?

参见:
Beefsteak Is Thinking:2月份三条感兴趣的图书馆自动化信息
图林中文译站:重构中的图书馆软件产业 / 图谋翻译、游园审校、KEVEN定稿  (September 24th, 2007)
倦鸟归林:webfeat express 2.0新功能 (2007年02月3日)
Library Technology Guides: WebFeat system for cross–database searching launched at The New York Public Library (June 21, 2007)

图林博客粉丝大比拼·结果篇

    小钟昨天宣布,历时40天的中文图林博客奥斯卡奖评选落幕

    看最终结果,在粉丝团的积极努力下,若干词语有了新的定义,比如技术、潜质、八卦……。
   
在评选的日子里,自己除一开始投了票,后来也曾不时去看结果(虽然在家里访问速度慢得实在可以)。常常不满于其他粉丝们下的定义,于是有几次身不由已地参与进去。坦白地说,曾多次努力想让“技术”与“怀念”保持自己认为正确的定义,最终结果是一败一成,实在是最后阶段大意了:(
   
相信最后阶段大意的人不止我一个。

    小钟宣布了总票数15790,但没有宣布总投票IP数。看那十大快抢手,第一名投了超过22%(在1/5-1/4之间)的票,如果加上另外一个也是该校的IP,基本上就占掉了1/4──真有能人哪,不得不服。小钟那儿肯定还有更好玩的数据 🙂
 
    通过此次评选,新获知了三个粉丝很强大的博客,是另一大收获。

参见:图林小钟
中文图林博客奥斯卡奖评选落幕
获奖名单
十大被顶次数排行
十大得票数排行
十大快枪手

参见:图林博客粉丝大比拼 (2008-01-17)