EURIG采用RDA调查-2013报告

欧洲RDA兴趣小组(EURIG)在2012年1、2月间首次对成员机构进行了采用RDA调查,报告7月发布。在20个回复机构中,4个有明确实施计划(荷兰国家图书馆、不列颠图书馆和德国国家图书馆2013年,芬兰国家图书馆2015年),12个在2012-2015年间做决定。(见:EURIG采用RDA调查-2012报告,2013年1月27日)
2013年7月EURIG进行了第二次采用RDA调查,报告2013年12月发布。EURIG目前有32个成员机构,收到回复24个。对实施RDA的问题,在23个回复机构中,13个有明确实施计划。与2012年调查相比,采用RDA的确定性有明显增加。法国国家图书馆的决定尤其令我印象深刻。
看不同机构对实施或不实施等的说明,可以对不同国家或机构眼中的RDA有更好的了解。

———-EURIG采用RDA调查-2013报告(不完全翻译)———-
EURIG survey on adoption of RDA – 2013: report / K Gryspeerdt (18 December 2013)

1、实施RDA
23个机构回答。
– 13个机构有明确实施计划,其中12个给出了进一步信息:
4个机构在2013年实施:荷兰国家图书馆、不列颠图书馆、Casalini Libri(为图书馆提供欧洲书籍、期刊、编目资料以及电子内容的意大利供应商),OCLC开始逐步实施。
4个机构计划2015年实施:瑞士国家图书馆、德国图书馆网络联盟(Arbeitsgemeinschaft der Verbundsysteme)、芬兰国家图书馆、德国国家图书馆
1个机构2016年实施:拉脱维亚国家图书馆
3个机构尚未决定实施日期:冰岛国家与大学图书馆、瑞典国家图书馆、法国国家图书馆
– 10个机构没有明确实施计划,其中3个进一步说明:
丹麦文化与书目机构:是否实施不是问题,只是何时未定。
— 挪威国家图书馆:没有正式决定。
— 葡萄牙国家图书馆:还没有决定。

2、实施RDA理由
12个机构回答。
– 可互操作性:12
– 当前编目规则需要修订或替代:11
– 想实施FRBR:7
– RDA包含收藏资料范围:5
– 费用效益:4
一些机构的说明:
– OCLC莱顿:荷兰图书馆有强烈的国际化与标准化需求,想尽可能在元数据管理领域减少本国准则与实践。注意:不确定RDA的“费用效益”是否会实现,我们期望不会增加成本(cost-neutral)。
– Casalini Libri:我们的美国顾客需要RDA记录。
法国国家图书馆:FRBR化目录是主要目标,RDA只是一个补充方式。因此RDA实施必须满足并兼容FRBR模型。我们把实施RDA作为未来目标的决定,也由于我们决心参与互操作框架中的国际元数据交换,尽可能避免国家特异性

3、不实施RDA理由
仅7个机构回复。
7个均选择理由:当前不实施,等其他机构实施的证明
个别机构选择的其他理由:订购费太贵;没有合适的译本;不具有费用效益
一些机构的说明:
– 丹麦文化与书目中心机构:我们仍在决定采用RDA的条件与时机的过程中。
波兰国家图书馆:我们正在进行RDA测试。
克罗地亚国家与大学图书馆:仍在考虑选择修订或制订本国编目规则。
– ISSN国际中心:ISSN网络使用ISSN手册中的ISSN规则。ISSN评审组(由ISSN国际中心和若干ISSN国家中心代表组成)参与协调ISBN、RDA和ISSN规则的国际努力,这对ISSN网络尤其重要,因为某些ISSN国家中心的主管机构已经开始或将在未来数月/数年中使用RDA。
葡萄牙国家图书馆:正进行RDA研究与翻译。
挪威国家图书馆:我们很可能实施,但还未正式决定。

4、实施RDA的期望益处
20个机构回答。
对5个方面,分短期(18-24月)和长期(2年以上):
应对变化:长期:5,短期:10
改进资源发现:长期:10,短期:8
可互操作性:长期:8,短期:12
提高生产率:长期:8
费用效益:长期:10
一些机构的说明:
– OCLC:区分“内容-载体”和“作品/内容表达-载体表现”,肯定有助于最终用户改进发现其所需资源。
– 法国国家图书馆:期望RDA(作为FRBR化我们资源的手段)提供展示书目信息的途径,对最终用户更直观,更符合Web环境中信息研究与发现的普遍趋势。
– 不列颠图书馆:希望看到节省费用,但不是主要动机;喜欢实施FRBR,但在实现前有很多依赖条件。但RDA比AACR2对电子资源更好,对于英国正实施的电子法定呈缴,现在成为我们编目生产的更重要组成部分。RDA也正被作为我们套录编目来源的其他主要图书馆和书目机构所采用。

5、RDA对生产率的影响
只要求已实施机构回答,开放性问题。4个机构回答。
– Casalini Libri:现在评估还太早
– 瑞士国家图书馆(2015年实施):必须调整工作流程……
– 德国国家图书馆:共享数据、共享知识、共享经验、协同合作
– 不列颠图书馆:对大部分资料类型没有太大变化,但对会议录和其他灰色文献,规范工作量增加。这不可持续,因此我们指导编目员遵从关于此类出版物规范检索点的核心需求。

6、数据库结构(略)

7、FRBR化
23个机构回答了全部2个FRBR化问题。
– 回溯FRBR化其数据【从底层处理数据】
— 未决定:13
— 计划:7
— 未打算:3
– FRBR化用户界面
— 未决定:14
— 计划:7
— 未打算:2

8、EURIG会议
最后一组问题关于EURIG会议日程与主办。
15个机构反对一年召开一次以上会议,若干选择本机构财政状况偏紧。更合适的替代论坛是视频会议与活跃的工作小组
12个机构愿意主办EURIG成员会议。【仍是一个有凝聚力的组织】
15个机构(大多数)表示倾向于在2014年3、4月举行EURIG会议,这样有时间计划向JSC的2014年11月会议准备讨论提案。【目前EURIG网站上还没有会议信息】

JSC主席Gordon Dunsire论《RDA和语义网》

RDA开发联合指导委员会(JSC)现任主席Gordon Dunsire于2014年3月4日在意大利佛罗伦萨大学作了题为“RDA与语义网”的报告,PPT共27页,不易看明白,但其报告内容作为图书馆学演讲丛书的一种,由Casalini Libri同时出版印刷与电子版。“本文简单讨论为了语义网自然选择而改进RDA的适应度,需要进一步工作的某些关键领域”(p.42)。
Gordon从当年的RDA局外人[2014-5-6更正:2007年他是作为RDA推广组代表成为DCMI/RDA共同主席的]到成为JSC掌门人,几乎全面参与了始于2007年伦敦数据模型会议的RDA(以及IFLA)的语义网相关工作,书中主要部分是“II.背景”,在介绍RDA、语义网的基本知识之后,对“RDA和语义网”的来龙去脉娓娓道来,又以大量图示解说语义网环境下的RDA,对相关内容、现状及有待解决的问题解说细致,无疑是最权威的信息来源。要完整全面了解“RDA与语义网”,值得花时间细读此书。
对于RDA在语义网方面迄今为止的进展,Gordon说明JSC除了考虑若干与RDA元素集有关的讨论稿之外,由于“在2010到2013年的优先考虑是解决由AACR3[2]到RDA转移的零星问题、回应RDA测试实施、以及RDA工具包后续出版,因此对在开放元数据注册(OMR)上进一步开发元素集几无进展”(p.24)。而由于“RDA的RDF表达的未完成状态,没有完全的RDA语义网实施”(p.36)。

需要特别提醒注意的是,RDA首先是“内容标准”,其与语义网产生关联,主要是其注册的元素集与取值词表,或者说是由RDA衍生出来的“元数据标准”,而非其编目规则本身。念及此,不免想到正在开发中的BIBFRAME,也是“适应语义网环境的元数据标准”(如伦敦会议对RDA的期许)。Gordon在文末总结时对RDA应用前景似不甚乐观,称“RDA必须与其他物种协作或竞争以生存或继续生存”(p.42),而BIBFRAME自是“其他物种”之一。

———《RDA与语义网》———
RDA and the semantic Web : lectio magistralis in library science : Florence, Italy, Florence University, 4th March, 2014 / Gordon Dunsire. Fiesole (Firenze) : Casalini Libri, 2014. (Letture magistrali in biblioteconomia; 7) ISBN 978-88-7656-012-5 (print) ISBN 978-88-7656-013-2 (ebook)
电子书PDF下载 ( 94 p.; p.7-42为英文版,其后为意大利文版,p.88-93为参考文献) 报告PPT下载

I. 导论 (p.7)

II. 背景 (p.7-29)
1.RDA

2.语义网
一些基本概念:资源描述框架(RDF)、三元组(triple),统一资源标识符(URI)、文字值串(literal),命名空间(namespace)、限定名称(QName),RDF图(graph)、三元组链(chain)、三元组群(cluster),东西(thing),推理规则,取值词表(value vocabularies)

3.数据模型会议
2007年不列颠图书馆主办伦敦数据模型会议,讨论RDA与语义元数据所用数据模型的关系。“对书目元数据元素集细粒度和复杂性需求的共同认识,导致了与会者间富有成效的讨论”。会议建议的若干活动,由会后成立的DCMI/RDA工作组实施:
– 开发RDA元素词汇
– 开发RDA DC应用纲要,基于FRBR和FRAD
– 公开RDA取值词表,采用RDF、RDFS和SKOS

4.对IFLA标准的影响
“‘伦敦会议’对IFLA开发语义网界使用的书目标准有着直接影响”:
– 2007年FRBR评审组讨论了为FRBR模型创建一个元素集。FRBR命名空间项目:
2011年,FRBR元素集在开放元数据注册(OMR)上发布
2012年,FRAD和FRSAD元素集在OMR上发布
2014年初,FRBRoo元素集将在OMR上发布
– 2009年ISBD评审组成立ISBD/XML研究组:
2011年,ISBD元素集、第0项内容形式和媒介类型取值词表在OMR上发布
开发了一个ISBD用DC应用纲要
【参见:FRBR系列元素集与取值词表出版(2012年5月27日)】

5.RDA元素词表的开发
根据“RDA元素分析表”(RDA Element Analysis Table)。最初注册在2008年6月到2009年6月间。“遇到的最重要问题包括FRBR模型的语义约束(constraints)【见6】,以及表达其他项的集合项【见7】”。
【参见:JSC会议有关RDA注册的讨论与决定(2012年11月18日) 】
【参见:Diane谈RDA元数据注册的设计(2012年11月18日) 】
【参见:RDA注册元素集终于正式发布(2014年1月23日) 】

6.FRBR约束
“RDA元素分析表”中大多数特性和关系被赋予一个FRBR实体的“领域”,将RDA属性的语义局限于FRBR应用。为鼓励更广泛的重用,DCMI/RDA工作组开发了一个并列的RDA属性集,不限特定领域或范围。
另外,为FRBR第2组实体增加了一个超级类(super-class)“代理”,以解决多领域解释RDA元素。

7.集合项
指由子元素组成的元素(如“出版项”元素由“出版日期”、“出版地”、“出版者名称”等子元素组成)。DCMI/RDA工作组采用出自都柏林核心抽象模型(DCAM)的“语法编码方案”(Syntax Encoding Scheme)概念的延伸,以适应特定格式,但仍有争议,DCMI社区讨论中。

8.迄今为止的进展
JSC考虑的若干与RDA元素集有关的讨论稿:
– ISBD元素集与RDA元素集的校准-RDA附录D.1【参见:ISBD与RDA的对照(2014年1月17日)】
– RDA中的机器可操作数据元素:讨论稿(CCDA,2013)
– RDA第3章中机器可操作数据元素(CCDA,2012)【参见:RDA第3章机器可操作数据元素(讨论稿)(2012年6月25日)】
– 映射ISBD和RDA元素集
– RDA关系说明语的RDF表达:讨论稿及后续

9.基于FRBR和FRAD开发RDA DC应用纲要(“本项活动密切依赖于RDA元素集,因而至今几无进展”)

10.采用RDF、RDFS和SKOS公开RDA取值词表
【参见:RDA注册第一批词汇表出版(2011年8月2日)】
【参见:RDA注册词汇表:内容、媒介、载体类型出版(2012年1月27日) 】

11.五年来(“2011年DCMI/RDA工作组经评估,后来重命名为DCMI书目元数据工作组”)
【参见:图书馆从传统数据观走向关联数据及语义网:五周年(2012年5月16日) 】

III. RDA和RDF (p.29-31)
1.DCAM(“RDA元素”词表的2个元数据模型:DCAM和<indecs>

IV. RDA命名空间 (p.32)
1.取值词表(有65个取值词表,由DCMI/RDA工作组创建。其中22个词表为“发布”状态,包含约200个概念)

V. 元素集 (p.32-36)
1.RDA元素(衍生自“元素分析表”的特性属性有约300个,关系属性约30个)

2.关系说明语
“RDA文本清楚表明,关系说明语细化关系。因此每个说明语应当作为RDF关系属性的子属性表达。DCMI/RDA工作组采用该方法,得到JSC批准”。但“元素分析表”将“关系说明语”视同取值词表。“JSC正监控这一交替表达的需求,组合使用两种方法,如MARC21关系词代码命名空间”
在RDA的RDF表达中,有约700个关系说明语属性及其倒转(逆属性,如(abridged as (work))与(abridgement of (work)),因此RDA元素集中属性总数超过1000个。

3.RDA/ONIX框架
JSC同意开发一个元素集表达框架本体,作为RDA与其他载体和内容术语表(如ISBD第0项)的互操作中心(hub)。本项工作有可能在2014年展开,JSC已经设立一个工作组。

VI. 语义网中的RDA (p.36-41)
“因为RDA的RDF表达的未完成状态,没有完全的RDA语义网实施”。但“现有‘新提出’元素集的若干属性已用于关联数据项目与服务”。
1.RDA领域模型
2.益处

VII. 结论 (p.42)
分析了伦敦数据模型会议提出的预期益处的实现状况:
– 图书馆界得到与Web架构兼容的元数据标准,与其他语义网计划完全互操作【元素词汇已发布】
– DCMI社区得到坚定基于DCAM和FRBR的图书馆应用纲要(将是其他可以遵循的高层纲要范本)【尚在任务清单中】
– 语义网社区得到一个可重用的、重要的经慎重考虑的元数据术语池【元素词汇已发布,取值词表部分发布】
– 让RDA得到更广泛采用(uptake)【有待观察】
“RDA是语义网生态系统中一个进化中的物种,在持续改变的环境中,仍在建立其生态区位(niche)的过程中……RDA必须与其他物种协作或竞争以生存或继续生存……”。

WorldCat作品关联数据问答

相关博文:OCLC以关联数据开放1.94亿书目作品(2014-2-27)[2014.4.28 正式发布]

Richard Wallis预告WorldCat作品关联数据之后(最早是在南非开普敦举行OCLC的EMEA地区委员会会议上),邮箱和推特等收到了很多回应,于是在自己博客上统一做了解答。摘译若干【本人想法】:
WorldCat Works Linked Data – Some Answers To Early Questions (March 4, 2014)

– 作品的准则是什么【尽管源自FRBR研究,但并不严格按照FRBR定义,只是从现有书目数据可以如何聚集考虑】
”作品“定义更多是若干相互依赖的算法处理结果,而不是一套简单的准则。……产生这些定义以及关系的工作是OCLC研究部针对FRBR的一项多年研究的持续结果:OCLC Research Activities and IFLA’s Functional Requirements for Bibliographic Records  [包括FictionFinder、xISBN、FRBR作品集算法、Work Records in WorldCat等]

– 会不会链接到单独的ISBN/ISNI记录【尽管没有做出决定,但和国际标准名称标识ISNI相比,无疑会更偏爱自家的虚拟国际规范档VIAF】
* ISBN – 用FRBR术语,ISBN是载体表现实体的属性,在已发布的WorldCat关联数据中可以找到。因为每个作品用schema:workExample链接到相关的载体表现实体,因此已链接到ISBN。
* ISNI – ISNI是个人标识号,ISNI的URI是链接作品到其他实体类型的候选者。VIAF的URI是我们会使用的个人/团体实体的另一个候选者,因为我们有数据。还没有最后决定用哪个URI,以及是否对相同关系使用多个URI。是对相同个人使用ISNI、VIAF和Dbpedia的URI,还是使用一个,然后依赖规范中心间的相互连接,是个还没有得出结论的问题。

– 当创建作品的记录组变化时,稳定的标识号如何管理【未定】
……当作品组分开或合并时,标识号如何维护的问题。这是未来数周这批数据完整发布前,开发团队正致力的任务之一。……

– 是否有批下载数据:没有【解释略。可以想见】

– WorldCat作品如何与BIBFRAME模型形成交集?对bf:Work的bf:hasAuthority,这些作品描述会很有用。【BF并非首选的考虑,Schema.org+SchemaBibEx才是OCLC的选择】
OCLC团队监控、参与、考虑许多可能——BIBFRAME、Schema.org、SchemaBibEx、WikiData等,这些对象有一些明显的协同效应,在方法及/或细节层面上对不同使用对象也有差异。使用sameAs互联数据集的潜在性,以及其他规范关系是重要的。随着WorldCat数据成熟以及其他数据集发布,大家会期望从一开始就关联许多不同来源的书目数据。

– 会使用ISTC么【作品不用。国际标准文本码ISTC基于语言分配,作品集中肯定会对应不只一个。只能如ISBN般做外部链接】
这方面现在做决定还太早。但我们不会期望存储ISTC号为作品的属性。ISTC是很多基于作品的数据集之一,调查识别相互间的sameAs关系将会很有趣。
ISTC号是基于语言分配的。以FRBR术语,出版语言与内容表达相关,而非作品层描述。因此在”作品“中不会有ISTC——我曾经的回答是:
— 注意WorldCat.org发布的作品被定义为schema:Creativework的实例。
— ……WorldCat也许不严格遵守FRBR规则与层级。我说”也许“也针对其后的建模,特定语言的作品也许只是一个更一般作品的实例——也许更像内容表达。在FRBR规则与更广泛的非图书馆理解之间,需要有一个平衡。

– 使用哪个三元组库(triplestore):不使用【解释略】