关联数据 – 第 43 页 – 编目精灵III

关联数据的图书馆应用问题

明天(2010.8.23)即将召开“2010图书馆前沿技术论坛：关联数据与书目数据的未来”，书社会中关联数据的讨论方兴未艾。虽然仍是门外汉，但对此一直颇感兴趣，也谈点想法。

对于关联数据的图书馆应用，我的理解有两个方面：一是图书馆发布，一是图书馆利用。

一、图书馆界以关联数据发布自己的信息，供本身或其他领域采用

除了国家图书馆或大型联合目录，大部分图书馆没有自己独特的信息需要以关联数据形式发布，无论是书目还是规范数据。

关联数据需要用URI（统一资源标识符）命名数据实体，现在图书馆界对很多实体并无统一的标识，因而普通图书馆即使把自己数据发布为关联数据，其标识还需要有机制与其他实际同一对象的标识进行关联……

特藏可能是一般图书馆可以用关联数据发布的信息。只是由于网络生态，大部分国内图书馆的特藏即使数字化了，仍然是养在深闺。不过，由于关联数据在本质上还是元数据，以关联数据形式公开发布信息并不影响资源的访问，只要对最终链接到的数字资源本身做访问限定即可。

接下来的问题是：图书馆发布的关联数据被应用的情况。Keven汇总了“图书馆的关联数据应用”，说明了图书馆以关联数据开放自己数据的情况。那么，这些被开放的数据得到应用了吗？又是如何被利用的？

二、图书馆利用已经发布的关联数据，为自己的服务增值

基于前述理由，我以为大部分图书馆应该是关联数据的用户而非提供者。那么，目前有哪些已经公开发布的关联数据可以应用到图书馆领域？有没有实例？

想像中最初级的应用如：在OPAC或网络资源导航中给有关人物、地点、主题、作品等提供扩展的链接？还有没有更好的应用？

———-分割线———-

图书馆发布与利用关联数据的技术，是自己接下来需要关注的问题，夏翠娟在会上有“用Drupal实现关联数据的发布”的报告。

我的“新编目标准RDA与关联数据”基本上是对Karen Coyle文章的解读，定型后再放链接（RDA Vocabularies for a Twenty-First-Century Data Environment. Chapter 4, RDA in RDF. Library Technology Reports, v.46, no.2, p.26-36）。[update 2010-8-27 PPT链接］

FOAF：朋友的朋友

关于FOAF (Friend of a friend)，来自维基百科词条（重新写过）：FOAF项目由Libby Miller和Dan Brickley始于2000，可被视为第一个社会语义网应用。FOAF是机读本体，使用RDF和OWL描述个人及其活动、与其他人和对象的关系。每个人都可以用FOAF描述自己，无需中央数据库即可描述一群人的社会网络。[用自己很粗浅的理解，即每个人按FOAF格式把描述自己及朋友的文档放到各自网站上，就可以关联起来形成一个人际关系网络。]
近年有若干国家图书馆把书目与规范记录发布为关联数据，人名部分用的正是FOAF。虚拟国际规范档(VIAF)也采用了FOAF。

一、书社会群组：图书馆关联数据
几天前远洋过客、Keven和pinoke建起了“图书馆关联数据”群组，应邀加入凑热闹。
公告：探讨图书馆资源语义化、关联化相关理念、方法与技术。
跟踪国外W3C Library Linked Data Incubator Group的动向，借鉴国外经验讨论本土化发展策略与实现手段。欢迎有兴趣的童鞋参加，分享资料，交流想法。

二、rainzen的日志：关于Linked Data群组的建议 (2010-06-11 05:38)
不料雨僧说，参加者必须要有自己的Foaf

三、远洋过客：［行动］怎样动手做：FOAF (2010-06-11 10:54)
转抄牛排博文：做个FOAF文档吧 (2009-08-29)
当初牛排写完博文，要我也做一个，我楞是没明白那是做什么的。后来看到瑞典国家图书馆、匈牙利国家图书馆用FOAF，也没想起牛排这博文，这下算是送来了及时雨。

四、pinoke：FOAF朋友索引 (2010-06-11 11:06)
持续更新中……

五、做自己的FOAF
为免还没进关联数据的门就被赶出去，赶快开工给自己建一个。要解决几个问题：
1、先要人指点给个FOAF阅读器（浏览器），如果建好了看不到效果，没动力。
后来Keven和远洋师都推荐了好几个，貌似都要用Firefox。
刚才再细读一遍牛排博文，原来文后那六个没有说明用途的链接，就是阅读器。牛排文章的前面部分写得绝对通俗，但最后部分没有起到对一窍不通的人扫盲的作用。
2、建好后如何放到自己的网站上，找CTO解决落实
3、按牛排的炒鸡蛋三部曲动手做FOAF
（一）登录FOAF老家http://www.ldodds.com/foaf/foaf-a-matic填写表单，繁体中文界面。
不喜欢上头像，就免了。朋友的SEE ALSO我填的是FOAF网址，比较麻烦的是email必填，不知道的就胡乱填了下（下步再删除）。点击FOAF me!就好了。
（二）在生成好的内容中找到乱填的email删除，然后复制、粘贴到记事本中，另存为foaf.rdf
（三）在FOAF浏览器中打开本地文件看下效果，满意后请CTO上传到网站（感谢CTO，我的FOAF：http://catwizard.net/foaf.rdf）
说明：
在FOAF项目网站上还有其它生成工具链接
自然也可以看网站上的FOAF语法自己手写（现在还是0.97版）

六、RDF浏览器（可读FOAF）
牛排列出并评价了六个RDF浏览器，还真需要好几个，因为每个浏览器对不同FOAF显示的效果都不一样，弄不好还有可能看到的只是页面源码。后二个是Keven另外推荐的Firefox插件。
总的感觉是，生成的FOAF文件本身可能有错，RDF浏览器还有很大的改进空间──虽然RDF是给机器看的，但人也需要看。

1. Tabulator Browser (MIT, USA)
[Firefox插件，需更改配置，可能降低安全性]

2. Marbles (FU Berlin, DE)
[在线浏览]

3. OpenLink RDF Browser (OpenLink, UK) 不错
[在线浏览]

4. Zitgist RDF Browser (Zitgist, USA) 不错
[在线浏览]

5. Disco Hyperdata Browser (FU Berlin, DE)
[在线浏览链接失效，实际同2]

6. Fenfire (DERI, Irland)

7. Semantic Radar
[安装后没看出效果]

8. The Data Browser Extension
[与Firefox 3.6.3不兼容，下载后无法安装]

关联数据的鸡与蛋

美国国会图书馆日前宣布强化规范与词表网站id.loc.gov [1]，继一年前的LCSH之后，再以关联数据提供如下5种词表的访问，以及词表数据的批量下载：
Thesaurus of Graphic Materials
MARC Code List for Relators
Cryptographic Hash Functions
Preservation Events
Preservation Level Role
后三者用于支持保存与技术元数据方案。
未来将增加的词表包括：MARC地理区域代表码、国家代码表、语种代表码，以及PREMIS控制词表。

Roy Tennant作了如此点评[2]：
面对关联与可链数据的增长生态，对能够做什么有各种推测，但实例或者说“杀手级应用”很少。
对于关联数据，仍处在鸡和蛋的阶段：除非有大量数据可用，否则你不能做什么有趣的东西；你没有大量数据可用，除非人们把它作为关联数据提供，不管是否缺少杀手级应用。为此赞美LC提供越来越多的数据，让我们都可以关联与使用。

[1] Catalogablog: ID.LOC.GOV Web Service Enhancements (May 28, 2010)

[2] TENNANT: DIGITAL LIBRARIES: LC Releases More Linked Data / by Roy Tennant (June 4th, 2010)