日志标签 ‘关联数据’

德国国家图书馆规范数据发布为关联数据

2010年10月9日
德国国家图书馆DNB在2010年4月曾宣布将把其名称和主题规范发布为关联数据,个人名称规范采用FOAF,主题采用SKOS及DC。日前已正式提供下载,包括:180万条个人名称(PND)、130万条团体(GKD),18.7万条主题(SWD)、5.1万个DDC类目(德文翻译)。下载地址:https://wiki.d-nb.de/display/LDS。目前如同大英图书馆,仅提供下载,作为一项长期任务,还计划提供全部国家书目数据,并且通过现有途径如OAI、SRU等提供数据服务。(参见:LINKED DATA SERVICE OF THE GERMAN NATIONAL LIBRARY已收录在“关联数据云”中,名称是Gem. Normdatei。
Linked Data Cloud
此图含链接,很有参考价值。看到右上角的LCSH后,相关的就也不难找了。(注意:此图超过1MB,下载速度很慢)
———-图书馆界的其他先行者———-
1、瑞典国家图书馆系统(LIBRIS)(2008)
首个把整个书目数据发布为关联数据的联合目录/国家图书馆目录(200多个成员馆超过650万条书目记录、20万条规范记录),采用Dublin Core, SKOS, FOAF,  Bibliontology
2、美国国会图书馆(2009-)
LCSH以SKOS发布(id.loc.gov) (2009.5)
Thesaurus of Graphic Materials等5种 (2010)
参见:关联数据的鸡与蛋 (2010-6-7)
3、OCLC (2009)
DDC以SKOS发布
虚拟国际规范档VIAF (viaf.org),对URI采用HTTP 303重定向,采用FOAF(2009.9)
4、匈牙利国家图书馆(NSZL)(2010.4)
全部书目数据/规范数据发表为关联数据,书目采用RDFDC, 人名规范采用foaf, 主题词与地理名称采用skos
5、大英图书馆 (2010.8)
———-更多实例———-
参见W3C语义网之维基:SKOS/Datasets
另参见:W3C图书馆关联数据孵化小组 (2010-5-23)
[update 2010-10-16, 来自远洋过客的信息,目前已收数十个案例与案例研究]

大英图书馆开放数据服务

2010年8月25日
大英图书馆(BL)宣布开放数据服务(Free Data Services),包含二方面内容:
√ Z39.50
包括大英图书馆全部目录或英国国家书目,MARC 21格式。
用户需注册,并承诺非商业用途,然后通过得到的用户名与密码访问。
√ 数据集
作为向图书馆界之外开放元数据的一部分,开放大英图书馆目录与英国国家书目供研究使用,以RDF/DC格式的XML文件提供,依创作共用之“非商业-相同方式共享”协议。
大英图书馆正调查以关联数据构造其目录信息的多种可能性,并与若干组织合作,探索使书目元数据以关联数据方式提供的问题。
———-评论的分割线———-
这是继今年4月匈牙利与德国国家图书馆先后宣布以关联数据发布书目/规范数据以来,又一个跟进的国家图书馆。虽然还只是提供XML文件,没有直接发布,但已经表明了态度。肯定会让关联数据的拥护者大为振奋的。
另一方面,虽然要MARC去死的呼声不断,目前MARC对图书馆界仍是不可或缺的,对编目员更是至关重要。前些年做《海外上海研究书目》时,数据源没有选择收藏颇丰的大英图书馆,根本原因就是它没有提供Z39.50方式,无法有效地获取数据。如果当年BL有Z39.50服务,这个书目肯定会更完善。
———-来源的分割线———-
现在几乎要到Google Reader只看People you follow的程度了──其实是在Lee Kai的Google Buzz分享里看到的消息。
Resource Shelf (August 24th, 2010)

关联数据的图书馆应用问题

2010年8月22日
明天(2010.8.23)即将召开“2010图书馆前沿技术论坛:关联数据与书目数据的未来”,书社会中关联数据的讨论方兴未艾。虽然仍是门外汉,但对此一直颇感兴趣,也谈点想法。
对于关联数据的图书馆应用,我的理解有两个方面:一是图书馆发布,一是图书馆利用。
一、图书馆界以关联数据发布自己的信息,供本身或其他领域采用
除了国家图书馆或大型联合目录,大部分图书馆没有自己独特的信息需要以关联数据形式发布,无论是书目还是规范数据。
关联数据需要用URI(统一资源标识符)命名数据实体,现在图书馆界对很多实体并无统一的标识,因而普通图书馆即使把自己数据发布为关联数据,其标识还需要有机制与其他实际同一对象的标识进行关联……
特藏可能是一般图书馆可以用关联数据发布的信息。只是由于网络生态,大部分国内图书馆的特藏即使数字化了,仍然是养在深闺。不过,由于关联数据在本质上还是元数据,以关联数据形式公开发布信息并不影响资源的访问,只要对最终链接到的数字资源本身做访问限定即可。
接下来的问题是:图书馆发布的关联数据被应用的情况。Keven汇总了“图书馆的关联数据应用”,说明了图书馆以关联数据开放自己数据的情况。那么,这些被开放的数据得到应用了吗?又是如何被利用的?
二、图书馆利用已经发布的关联数据,为自己的服务增值
基于前述理由,我以为大部分图书馆应该是关联数据的用户而非提供者。那么,目前有哪些已经公开发布的关联数据可以应用到图书馆领域?有没有实例?
想像中最初级的应用如:在OPAC或网络资源导航中给有关人物、地点、主题、作品等提供扩展的链接?还有没有更好的应用?
———-分割线———-
图书馆发布与利用关联数据的技术,是自己接下来需要关注的问题,夏翠娟在会上有“用Drupal实现关联数据的发布”的报告。
我的“新编目标准RDA与关联数据”基本上是对Karen Coyle文章的解读,定型后再放链接(RDA Vocabularies for a Twenty-First-Century Data Environment. Chapter 4, RDA in RDF. Library Technology Reports, v.46, no.2, p.26-36)。[update 2010-8-27 PPT链接

FOAF:朋友的朋友

2010年6月12日

FOAF关于FOAF (Friend of a friend),来自维基百科词条(重新写过):FOAF项目由Libby Miller和Dan Brickley始于2000,可被视为第一个社会语义网应用。FOAF是机读本体,使用RDF和OWL描述个人及其活动、与其他人和对象的关系。每个人都可以用FOAF描述自己,无需中央数据库即可描述一群人的社会网络。[用自己很粗浅的理解,即每个人按FOAF格式把描述自己及朋友的文档放到各自网站上,就可以关联起来形成一个人际关系网络。]
近年有若干国家图书馆把书目与规范记录发布为关联数据,人名部分用的正是FOAF。虚拟国际规范档(VIAF)也采用了FOAF。

一、书社会群组:图书馆关联数据
几天前远洋过客、Keven和pinoke建起了“图书馆关联数据”群组,应邀加入凑热闹。
公告:探讨图书馆资源语义化、关联化相关理念、方法与技术。
跟踪国外W3C Library Linked Data Incubator Group的动向,借鉴国外经验讨论本土化发展策略与实现手段。欢迎有兴趣的童鞋参加,分享资料,交流想法。

二、rainzen的日志:关于Linked Data群组的建议 (2010-06-11 05:38)
不料雨僧说,参加者必须要有自己的Foaf

三、远洋过客:[行动]怎样动手做:FOAF (2010-06-11 10:54)
转抄牛排博文:做个FOAF文档吧 (2009-08-29)
当初牛排写完博文,要我也做一个,我楞是没明白那是做什么的。后来看到瑞典国家图书馆、匈牙利国家图书馆用FOAF,也没想起牛排这博文,这下算是送来了及时雨。

四、pinoke:FOAF朋友索引 (2010-06-11 11:06)
持续更新中……

五、做自己的FOAF
为免还没进关联数据的门就被赶出去,赶快开工给自己建一个。要解决几个问题:
1、先要人指点给个FOAF阅读器(浏览器),如果建好了看不到效果,没动力。
后来Keven和远洋师都推荐了好几个,貌似都要用Firefox。
刚才再细读一遍牛排博文,原来文后那六个没有说明用途的链接,就是阅读器。牛排文章的前面部分写得绝对通俗,但最后部分没有起到对一窍不通的人扫盲的作用。
2、建好后如何放到自己的网站上,找CTO解决落实
3、按牛排的炒鸡蛋三部曲动手做FOAF
(一)登录FOAF老家http://www.ldodds.com/foaf/foaf-a-matic填写表单,繁体中文界面。
不喜欢上头像,就免了。朋友的SEE ALSO我填的是FOAF网址,比较麻烦的是email必填,不知道的就胡乱填了下(下步再删除)。点击FOAF me!就好了。
(二)在生成好的内容中找到乱填的email删除,然后复制、粘贴到记事本中,另存为foaf.rdf
(三)在FOAF浏览器中打开本地文件看下效果,满意后请CTO上传到网站(感谢CTO,我的FOAF:http://catwizard.net/foaf.rdf)
说明:
在FOAF项目网站上还有其它生成工具链接
自然也可以看网站上的FOAF语法自己手写(现在还是0.97版)

六、RDF浏览器(可读FOAF)
牛排列出并评价了六个RDF浏览器,还真需要好几个,因为每个浏览器对不同FOAF显示的效果都不一样,弄不好还有可能看到的只是页面源码。后二个是Keven另外推荐的Firefox插件。
总的感觉是,生成的FOAF文件本身可能有错,RDF浏览器还有很大的改进空间──虽然RDF是给机器看的,但人也需要看。

1. Tabulator Browser (MIT, USA)
[Firefox插件,需更改配置,可能降低安全性]

2. Marbles (FU Berlin, DE)
[在线浏览]

3. OpenLink RDF Browser (OpenLink, UK) 不错
[在线浏览]

4. Zitgist RDF Browser (Zitgist, USA) 不错
[在线浏览]

5. Disco Hyperdata Browser (FU Berlin, DE)
[在线浏览链接失效,实际同2]

6. Fenfire (DERI, Irland)

7. Semantic Radar
[安装后没看出效果]

8. The Data Browser Extension
[与Firefox 3.6.3不兼容,下载后无法安装]

关联数据的鸡与蛋

2010年6月7日

美国国会图书馆日前宣布强化规范与词表网站id.loc.gov [1],继一年前的LCSH之后,再以关联数据提供如下5种词表的访问,以及词表数据的批量下载:
Thesaurus of Graphic Materials
MARC Code List for Relators
Cryptographic Hash Functions
Preservation Events
Preservation Level Role
后三者用于支持保存与技术元数据方案。
未来将增加的词表包括:MARC地理区域代表码、国家代码表、语种代表码,以及PREMIS控制词表。

Roy Tennant作了如此点评[2]:
面对关联与可链数据的增长生态,对能够做什么有各种推测,但实例或者说“杀手级应用”很少。
对于关联数据,仍处在鸡和蛋的阶段:除非有大量数据可用,否则你不能做什么有趣的东西;你没有大量数据可用,除非人们把它作为关联数据提供,不管是否缺少杀手级应用。为此赞美LC提供越来越多的数据,让我们都可以关联与使用。

[1] Catalogablog: ID.LOC.GOV Web Service Enhancements (May 28, 2010)

[2] TENNANT: DIGITAL LIBRARIES: LC Releases More Linked Data / by Roy Tennant (June 4th, 2010)