RDA为3R项目所做修改(附:多个首选名称)

RDA将于2017.4-2018.4实施为期一年的“RDA工具包重构和重设计”(3R)项目,期间将冻结RDA内容。RSC现任主席Gordon Dunsire本月初向RSC提交文件《RDA为3R项目所做准备》(RSC/Chair/18),概述RDA工具包2017年2月发布中将出现的一些术语或措辞的变化,以及变化的背景。
这些变化主要是用词标准化,不影响条款的解释与使用,是为3R项目、包括根据IFLA《图书馆参考模型》(LRM)修改RDA做准备,同时方便RDA内容冻结期间,RDA译本尽早使用与LRM一致的标准化用词(译本大多尚未与最新英语版同步,更新将体现在工具包2017年8月发布中[update 2017-2-23: 2017年2月发布版,德、法、西、意译本均已与2016年4月更新同步])。

Preparation of RDA for the 3R Project (RSC/Chair/18, 2017-2-7)
背景
– 3R项目(参见[1]之“迈步向前(工具包重构与重设计)”)
– LRM(参见[2][3])
– 译本(参见[1]之“RDA翻译”)
– RDA条款组织
按LRM,每个实体单独处理(某些在2个实体内组织的元素将被拆开,如作品和内容表达部分)

RDA工具包2017年2月发布的变化
– RDA元素定义、标签和工具包条款中,“资源”由具体实例的首选标签代替,即分别使用“作品”“内容表达”“载体表现”或“单件”。
– 词组“个人、家族和/或团体”及其复数形式分别由“施事者/行为主体”(agent)单数复代替。
– 从RDA元素标签中去除英语不定冠词a/an和定冠词the。如“identifier for the item”变为“identifier for item”,使元素和说明语的标签一致,为新元素和说明语提供一个模板。
– 在用于记录一个元素时,定冠词the(该)用不定冠词a/an(一个)代替。例如RDA9.2.2.2中,“从下列来源确定该首选名称”替换为“从下列来源确定一个首选名称”。本改变及以单数形式引用一个元素强调,不强制RDA元素的可重复性,给予一个编目社区选择记录任何元素的一个或多个版本。【RDA-L对“可重复性”的讨论见下“多个首选名称”】
– 某些条款和元素定义中,“和/或”用“或”代替。“或”可用在更广泛的、包括含义“A或B或两者” 。
从检索点条款中移除“按此顺序”。这给予一个编目社区选择按条款的呈现顺序或者某些其他顺序来构建检索点。(不规定检索点中元素的先后顺序,参见[3]之“对RDA规范检索点的影响”)

相关博文:
[1] RDA是个全球标准吗?以使用、翻译和治理作为指标(2016-10-20)
[2] RDA将在2017年依照IFLA-LRM更新(2016-11-21)
[3] RDA实施IFLA-LRM公告(2017-2-6)

——— 多个首选名称:规范控制不再依赖规范检索点 ———
[RDA-L] More than one preferred name? (2017-2-8)
– 对于上述文件中the用a/an替代部分称“不强制RDA元素的可重复性,给予一个编目社区选择记录任何元素的一个或多个版本”,RDA-L邮件组中的活跃人物,德国斯图加特媒体大学教授Heidrun Wiesenmueller提出疑问:像个人的首选名称、正题名或作品的首选题名这样的元素,(在同一应用社区)难道不是不可重复的吗?
美国塔夫茨大学的Steve McDonald认为,上述规定指“确定_一个_首选形式”,并未重复。“而隐含的形式多样性来自这种可能性,即其他来源的书目和规范记录可能使用不同形式……用关联数据,还可能明确关联在不同目录中表达的实体……事实上,图书馆还有可能为不同用户定制首选形式:一个用户可能首选古代文献学者们所用的名称形式,而另一个用户首选在IMDB中使用的名称形式”。
著名博主James L. Weinheimer则直接称,“我猜想这是个面对关联数据的前瞻性规则”。“不必有其名称的单个‘首选形式’……只要配置正确,目录将能显示任何或所有来自VIAF记录的信息,而不是100$a……”。他同样设想了因人而异的显示形式。
– 权威诠释来自JSC主席,他首先肯定了前2位的回复,然后做了自己的说明。其中引述他本人在2014年IFLA年会的文章,提到RDA希望在国际文化遗产界实施,“在能够实施RDA前,各界、各机构不应该也不必决定一个元素的‘首选’标签,毕竟在国际书目控制(UBC)的15年间,国际图书馆界并没有做到。”“简单地说:当来自一个机构库、图书馆管理系统和机构档案的数据——均使用RDA——关联在一起(通过URI或规范控制号对照),每个来源使用一个不同的首选名称,会发生什么?结果是多个首选名称,数据由其他更有效方式合在一起”。

正如刘炜、张春景、夏翠娟(2015)在《万维网时代的规范控制》中所指出的,“可以URI……使‘标目’问题得到完美解决,即不需要选择任何一种优先形式作为标目”。BIBFRAME取消规范类,也是出于相同的考虑(参见2016《BIBFRAME核心类演变分析》)。

美国国家档案馆规范记录采用RDA

2016年底,美国国家档案馆(国家档案与记录管理局,NARA)宣布其规范记录将采用RDA标准,并将之作为该馆走向透明、参与和开放的“开放政府”的转折点。其馆长官方博客Aotus Blog称,这是“加入更广泛的档案界”,说明美国档案界在规范记录方面采用RDA已有不少。

博文称期待采用RDA将向员工和用户提供的机会包括:
– 参与跨机构协作与合作
– 为导航和可视化建立可以借助的关联等级关系
– 关联和再利用NARA数据到其他来源
– 利用档案界建立和使用的开源工具
– 在整个生命周期中管理联邦记录
– 发展NARA员工专业,强化其能力,并增加与其他机构的协作

这是个采用决定而非实施通告,具体实施步骤还有待2017年在分析NARA工作“过程、系统和数据模型”后确定。不管怎样,这是RDA跨界向文化遗产领域扩展的一个重大进展。

Via Aotus Blog: Reaching Out with RDA (2016-12-20)

NISO发布入门读物《理解元数据》

NISO上月发布初入门读物《理解元数据》。2004年时NISO曾发布过类似出版物,此为十多年后的更新版。作者Jenn Riley是加拿大麦吉尔大学图书馆数字倡议部副主任(Associate Dean, Digital Initiatives),特别说明此次增加了关联数据相关内容。
本指南重点在文化遗产领域的元数据,读者对象是已经用元数据工作的有经验的信息管理者,以及不太熟悉信息交换问题的专业人员。对于元数据的作用,NISO执行理事Todd Carpenter称: “在数字世界,有关内容的信息常会比内容本身更重要。没有好的元数据,信息有效性就消失了。”

UNDERSTANDING METADATA: WHAT IS METADATA, AND WHAT IS IT FOR? / Jenn Riley. National Information Standards Organization (NISO), 2017. 45 pages. ISBN 978-1-937522-72-8

本入门中,各种常见元数据的介绍占很大篇幅,一般都会介绍其标记方式(XML、RDF等),但并没有统一形式,看起来比较轻松。
非常有意思的是,在开始的“日常生活中的元数据”部分,特别提出亚马逊的元数据行动(p.3, Metadata in Action: Amazon and its Affiliates),又在结束的“元数据如何生成”部分提到亚马逊通过ONIX供应链共享元数据(p.38),但始终没有介绍Amazon采用的元数据格式。
“未来方向”部分,对“众包”的评价相当高,也确实反映现实:
元数据的开放与互联的新兴文化,导致对“权威”或“好的”元数据的重新定义……几乎每个论题线上都有见多识广的爱好者社区,相比承担内容管理职责、但缺少这一主题专家的机构,这些个人常能提供好得多的元数据。智能系统可结合更传统来源的元数据与用户生成元数据……。(p.40)

这是NISO“入门出版物”系列第2本,2015年已发布《研究数据管理》。参见:NISO发布初级读物《研究数据管理》(2015-9-7)

Via NISO Press Release: NISO Publishes “Understanding Metadata” Primer (2017-1-18)

——— 《理解元数据》目次(及笔记概要) ———

导言
日常生活中的元数据 (2012谷歌“知识图谱”:35亿“事实”,约5亿元数据-人、地、事及关系;2010 LC存档推特内容及元数据)
文化遗产世界中的元数据 (图档博)
元数据类型 (1描述元数据;2管理元数据:技术/保存/权利;3结构元数据;4标记语言)
元数据如何存储与分享?
– 关系数据库
– XML (2000s)
– 关联数据和RDF (2006)
标准化元数据
– 受控词表 (提及:Internet MIME types, Spotify genres, BISAC, LCSH)
– 内容标准 (提及:Wikipedia Manual of Style guidelines for Infoboxes, DACS, RAD, AACR2, RDA)
著名元数据语言:广泛使用的例子
– Schema.org (2011发布,近600“类型”、超800属性。2014.4 OCLC用来发布近2亿图书等的书目描述)
– OWL:Web本体语言
– SKOS:简单知识组织系统
– DC:都柏林核心 (DC、DCTerms。有对《DCMI抽象模型》和《新加坡框架》的简评)
– FOAF:朋友的朋友
– ONIX:联机信息交换 (1图书,2连续出版物,3出版物许可证。2009年3.0支持电子书)
– Exif:可交换图像文件格式 (Tiff和JPEG支持嵌入Exif,但JPEG2000,PNG,GIF不支持)
著名元数据语言:文化遗产界的例子
– MARC:机读目录 (1968)
– BIBFRAME:书目框架项目 (2016.4发布2.0)
– MODS:元数据对象描述方案 (20个顶层元素)
– CIDOC CRM:CIDOC概念参考模型 (博物馆界,基础本体。区别性特征:不仅专注描述文化遗产对象,而且专注与其创建与生命周相关的行动与事件)
– CDWA:艺术作品描述类别 (艺术博物馆界,540个数据元素及其关系)
– VRA Core:视觉资源协会核心 (艺术史、艺术与建筑,有约束版、非约束版。区别性特征:有关艺术作品本身的元数据与有关这些作品图像的元数据分离)
– EAD:编码档案描述
– 著名元数据语言:其他例子
— DDI:数据文档项目(大元素集,描述社会、行为和经济科学中的数据……随着研究界越来越重视数据管理规划,以及研究数据的开放传播和长期管理,DDI越来越重要)
— PREMIS:保存元数据实施策略 (数字归档领域。定义5个实体:对象,环境,事件,行为主体,权利)
— TEI:文本编码项目 (机读文本标记语言。文本元素:1基本结构特性;2语义元素;3超或非文本特性:表格,嵌入图形)
— MEI:音乐编码项目 (乐谱,基于TEI)
元数据如何生成? (1人力、专家;2自动处理;3分享;4自动生成:自动转录讲话,脸部识别,潜在语义分析和论题建模,时态和名称-实体识别,自动图像标注,音乐信息检索)
未来方向 (1关联数据;2自动创建和维护元数据;3元数据开放与互联:众包、用户生成元数据)
附录A:资源
– 元数据标准和词表
– XML标准和资源
– RDF标准和资源
– RDF序列化
– 关联数据资源
– 观察项目(BIBFRAME,DBPedia,DPLA)