西班牙国家图书馆关联数据发布

还是来自远洋师在书社会发布的消息:
西班牙国家图书馆书目的关联数据发布了
相同内容另见:W3C关联开放数据邮件组消息链接(From: Boris Villazon-Terrazas, 13 Feb 2012)

远洋师认为,“这个书目数据的本体显然是以FRBR为基础的http://www.bne.es/es/Catalogos/DatosEnlazados/Modelos/”

有240万条转为RDF的书目记录,含专著、录音资料和乐谱;还有400万条个人、团体、统一题名及主题的规范记录。这些规范记录生成了5800万条RDF三元组,以及60万wol:sameAs关联到DBPedia、VIAF及法国、德国、瑞典的国家图书馆目录。

作为“西班牙国家图书馆关联数据”项目(Linked data at the BNE)的一部分,在国图支持下由马德里理工大学的本体工程组(Ontology Engineering Group, OEG)实施,采用OEG自己的MARiMbA工具,由MARC21记录生成采用不同RDFS/OWL词表的RDF。
与德国图书馆图书馆一样,也采用CC0(创作共用-公共域)协议。

访问地址:
http://datos.bne.es/
SPARQL endpoint网址
项目网址:the Data Hub
MARiMbA工具网址

———-西方国家的国家图书馆发布关联数据的时间线———-
瑞典(书目2008)、美国(词表2009)、匈牙利(书目/规范2010)、英国(书目2010,未直接发布)、德国(规范2010,书目2012)、西班牙(书目/规范2012)。

参见:德国国家书目发布为关联开放数据(2012年2月1日)
更多链接参见:德国国家图书馆规范数据发布为关联数据(2010年10月9日)

德国国家书目发布为关联开放数据

又是来自远洋师在书社会发布的消息:

The German National Bibliography as Linked Open Data (2012-2-1)
相同内容另见:W3C图书馆关联数据邮件组消息链接(From: Hauser, Julia;25 Jan 2012)

不少西方国家的国家图书馆将书目与规范数据发布为关联数据的工作一直在进行中。

德国国家图书馆DNB在2010年4月曾宣布将把其名称和主题规范发布为关联数据(2010年3月31日开始原型服务),2012年1月,书目数据也发布为关联数据,许可协议更改为“创作共同0”(CC0)──无版权。

目前为第一阶段,未包括乐谱与Deutsches Exilarchiv。记录的RDF/XML表达通过DNB portal提供,本实验服务将持续扩充与改进。详细信息及进一步过程已有德文版(Version 4.0,Stand: 18. Januar 2012;46p.),英文版也将更新。

今天下载的英文版还是2011年4月的版本:
The Linked Data Service of the German National Library (Version 3.1, April 21st, 2011;33p.)
[update 2012-8-19: 3.1版本体建模(p.6)采用了12个本体(当指规范部分,与书目不同):
• ABC-Ontology
• Bibliographic Ontology Specification
• BIO: A vocabulary for biographical information
• DCMI Metadata Terms
• FOAF Vocabulary Specification
• GeoNames Ontology
• MarcOnt
• Music Ontology
• Ontologie der Wissenschaftsdisziplinen
• Provenance Vocabulary Core Ontology
• RDA Element Sets(p.9 个人/团体描述和实体间关系表达基于RDA第2组元素个人/团体/家族关系 [后者未列入RDA注册词表])
• Relationship Vocabulary]
[update 2012-8-19: 4.2版书目数据模型6个本体,有ISBD,没有RDA:
· Bibliographic Ontology (Bibo)
· International Standard Bibliographic Description (ISBD)
· Dublin Core
· RDF Schema
· OWL
· FOAF]

参见:德国国家图书馆规范数据发布为关联数据(2010年10月9日)

SKOSsy:利用DBPedia自动生成叙词表?

奥地利的语义Web公司(Semantic Web Compan)正在开发一个自动生成英语和德语叙词表的工具SKOSsy。SKOSsy可以针对某个领域,从维基百科的关联数据形式DBPedia中抽取数据,生成基于SKOS的叙词表“种子”,随后再使用专门的叙词表编辑工具清理,增加概念、关系及链接等。也就是说不必一切从零开始了。

据该公司博客介绍,利用SKOSsy制作某一领域叙词表雏形,然后使用PoolParty系列工具完成词表,进而自动标引、形成检索系统的过程如下:
1、在维基百科/DBPedia中找到最合适的类别
2、由SKOSsy遍历DBPedia收集所有资源、等级与非等级关系、交替标签、定义及其他属性,并组织成一个有效的SKOS叙词表。整个过程持续几分钟。
3、把初成的叙词表装入PoolParty Thesaurus Manager (PPT),人工完善。
4、使用PoolParty Extractor (PPX)生成定制的文本抽取器。
5、用PPX从文档中自动抽取命名的实体并做索引。
6、数秒钟后语义搜索引擎就可以用了。 PoolParty Semantic Search (PPS)可以提供类别自动完成、分面检索、内容推荐(类似检索)及智能检索提示。

这广告实在很生动。虽然博文中提供了一个自动生成的示例词表的链接,但需要登录才能看,效果不明。想要实际体验的话,可以向他们发送自己感兴趣的领域,他们会向你发送测试邀请,或者为你准备一段演示。

Via mod librarian: Metadata Monday: Automated Controlled Vocabularies?(梯子自备)

SKOSsy Dynamically Generates Thesauri: Automated Controlled Vocabularies A Real Possibility?
by NARESH SARWAN on DECEMBER 2, 2011

Introducing SKOSsy – generate thesauri on the fly!
November 29, 2011 by Andreas Blumauer