JSC主席Gordon Dunsire论《RDA和语义网》

RDA开发联合指导委员会(JSC)现任主席Gordon Dunsire于2014年3月4日在意大利佛罗伦萨大学作了题为“RDA与语义网”的报告,PPT共27页,不易看明白,但其报告内容作为图书馆学演讲丛书的一种,由Casalini Libri同时出版印刷与电子版。“本文简单讨论为了语义网自然选择而改进RDA的适应度,需要进一步工作的某些关键领域”(p.42)。
Gordon从当年的RDA局外人[2014-5-6更正:2007年他是作为RDA推广组代表成为DCMI/RDA共同主席的]到成为JSC掌门人,几乎全面参与了始于2007年伦敦数据模型会议的RDA(以及IFLA)的语义网相关工作,书中主要部分是“II.背景”,在介绍RDA、语义网的基本知识之后,对“RDA和语义网”的来龙去脉娓娓道来,又以大量图示解说语义网环境下的RDA,对相关内容、现状及有待解决的问题解说细致,无疑是最权威的信息来源。要完整全面了解“RDA与语义网”,值得花时间细读此书。
对于RDA在语义网方面迄今为止的进展,Gordon说明JSC除了考虑若干与RDA元素集有关的讨论稿之外,由于“在2010到2013年的优先考虑是解决由AACR3[2]到RDA转移的零星问题、回应RDA测试实施、以及RDA工具包后续出版,因此对在开放元数据注册(OMR)上进一步开发元素集几无进展”(p.24)。而由于“RDA的RDF表达的未完成状态,没有完全的RDA语义网实施”(p.36)。

需要特别提醒注意的是,RDA首先是“内容标准”,其与语义网产生关联,主要是其注册的元素集与取值词表,或者说是由RDA衍生出来的“元数据标准”,而非其编目规则本身。念及此,不免想到正在开发中的BIBFRAME,也是“适应语义网环境的元数据标准”(如伦敦会议对RDA的期许)。Gordon在文末总结时对RDA应用前景似不甚乐观,称“RDA必须与其他物种协作或竞争以生存或继续生存”(p.42),而BIBFRAME自是“其他物种”之一。

———《RDA与语义网》———
RDA and the semantic Web : lectio magistralis in library science : Florence, Italy, Florence University, 4th March, 2014 / Gordon Dunsire. Fiesole (Firenze) : Casalini Libri, 2014. (Letture magistrali in biblioteconomia; 7) ISBN 978-88-7656-012-5 (print) ISBN 978-88-7656-013-2 (ebook)
电子书PDF下载 ( 94 p.; p.7-42为英文版,其后为意大利文版,p.88-93为参考文献) 报告PPT下载

I. 导论 (p.7)

II. 背景 (p.7-29)
1.RDA

2.语义网
一些基本概念:资源描述框架(RDF)、三元组(triple),统一资源标识符(URI)、文字值串(literal),命名空间(namespace)、限定名称(QName),RDF图(graph)、三元组链(chain)、三元组群(cluster),东西(thing),推理规则,取值词表(value vocabularies)

3.数据模型会议
2007年不列颠图书馆主办伦敦数据模型会议,讨论RDA与语义元数据所用数据模型的关系。“对书目元数据元素集细粒度和复杂性需求的共同认识,导致了与会者间富有成效的讨论”。会议建议的若干活动,由会后成立的DCMI/RDA工作组实施:
– 开发RDA元素词汇
– 开发RDA DC应用纲要,基于FRBR和FRAD
– 公开RDA取值词表,采用RDF、RDFS和SKOS

4.对IFLA标准的影响
“‘伦敦会议’对IFLA开发语义网界使用的书目标准有着直接影响”:
– 2007年FRBR评审组讨论了为FRBR模型创建一个元素集。FRBR命名空间项目:
2011年,FRBR元素集在开放元数据注册(OMR)上发布
2012年,FRAD和FRSAD元素集在OMR上发布
2014年初,FRBRoo元素集将在OMR上发布
– 2009年ISBD评审组成立ISBD/XML研究组:
2011年,ISBD元素集、第0项内容形式和媒介类型取值词表在OMR上发布
开发了一个ISBD用DC应用纲要
【参见:FRBR系列元素集与取值词表出版(2012年5月27日)】

5.RDA元素词表的开发
根据“RDA元素分析表”(RDA Element Analysis Table)。最初注册在2008年6月到2009年6月间。“遇到的最重要问题包括FRBR模型的语义约束(constraints)【见6】,以及表达其他项的集合项【见7】”。
【参见:JSC会议有关RDA注册的讨论与决定(2012年11月18日) 】
【参见:Diane谈RDA元数据注册的设计(2012年11月18日) 】
【参见:RDA注册元素集终于正式发布(2014年1月23日) 】

6.FRBR约束
“RDA元素分析表”中大多数特性和关系被赋予一个FRBR实体的“领域”,将RDA属性的语义局限于FRBR应用。为鼓励更广泛的重用,DCMI/RDA工作组开发了一个并列的RDA属性集,不限特定领域或范围。
另外,为FRBR第2组实体增加了一个超级类(super-class)“代理”,以解决多领域解释RDA元素。

7.集合项
指由子元素组成的元素(如“出版项”元素由“出版日期”、“出版地”、“出版者名称”等子元素组成)。DCMI/RDA工作组采用出自都柏林核心抽象模型(DCAM)的“语法编码方案”(Syntax Encoding Scheme)概念的延伸,以适应特定格式,但仍有争议,DCMI社区讨论中。

8.迄今为止的进展
JSC考虑的若干与RDA元素集有关的讨论稿:
– ISBD元素集与RDA元素集的校准-RDA附录D.1【参见:ISBD与RDA的对照(2014年1月17日)】
– RDA中的机器可操作数据元素:讨论稿(CCDA,2013)
– RDA第3章中机器可操作数据元素(CCDA,2012)【参见:RDA第3章机器可操作数据元素(讨论稿)(2012年6月25日)】
– 映射ISBD和RDA元素集
– RDA关系说明语的RDF表达:讨论稿及后续

9.基于FRBR和FRAD开发RDA DC应用纲要(“本项活动密切依赖于RDA元素集,因而至今几无进展”)

10.采用RDF、RDFS和SKOS公开RDA取值词表
【参见:RDA注册第一批词汇表出版(2011年8月2日)】
【参见:RDA注册词汇表:内容、媒介、载体类型出版(2012年1月27日) 】

11.五年来(“2011年DCMI/RDA工作组经评估,后来重命名为DCMI书目元数据工作组”)
【参见:图书馆从传统数据观走向关联数据及语义网:五周年(2012年5月16日) 】

III. RDA和RDF (p.29-31)
1.DCAM(“RDA元素”词表的2个元数据模型:DCAM和<indecs>

IV. RDA命名空间 (p.32)
1.取值词表(有65个取值词表,由DCMI/RDA工作组创建。其中22个词表为“发布”状态,包含约200个概念)

V. 元素集 (p.32-36)
1.RDA元素(衍生自“元素分析表”的特性属性有约300个,关系属性约30个)

2.关系说明语
“RDA文本清楚表明,关系说明语细化关系。因此每个说明语应当作为RDF关系属性的子属性表达。DCMI/RDA工作组采用该方法,得到JSC批准”。但“元素分析表”将“关系说明语”视同取值词表。“JSC正监控这一交替表达的需求,组合使用两种方法,如MARC21关系词代码命名空间”
在RDA的RDF表达中,有约700个关系说明语属性及其倒转(逆属性,如(abridged as (work))与(abridgement of (work)),因此RDA元素集中属性总数超过1000个。

3.RDA/ONIX框架
JSC同意开发一个元素集表达框架本体,作为RDA与其他载体和内容术语表(如ISBD第0项)的互操作中心(hub)。本项工作有可能在2014年展开,JSC已经设立一个工作组。

VI. 语义网中的RDA (p.36-41)
“因为RDA的RDF表达的未完成状态,没有完全的RDA语义网实施”。但“现有‘新提出’元素集的若干属性已用于关联数据项目与服务”。
1.RDA领域模型
2.益处

VII. 结论 (p.42)
分析了伦敦数据模型会议提出的预期益处的实现状况:
– 图书馆界得到与Web架构兼容的元数据标准,与其他语义网计划完全互操作【元素词汇已发布】
– DCMI社区得到坚定基于DCAM和FRBR的图书馆应用纲要(将是其他可以遵循的高层纲要范本)【尚在任务清单中】
– 语义网社区得到一个可重用的、重要的经慎重考虑的元数据术语池【元素词汇已发布,取值词表部分发布】
– 让RDA得到更广泛采用(uptake)【有待观察】
“RDA是语义网生态系统中一个进化中的物种,在持续改变的环境中,仍在建立其生态区位(niche)的过程中……RDA必须与其他物种协作或竞争以生存或继续生存……”。