IFLA胎死腹中的数字资源元数据指南:元数据类型和核心元素

元数据有很多不同的划分方法。如:
曾蕾与秦健教授的《元数据》分为4种:1数据结构标准,2数据内容标准,3数据值标准,4数据交换标准。参见:元数据和编目标准类型(2014-5-8)
NISO的《理解元数据》分为4种:1描述元数据;2管理元数据(技术/保存/权利);3结构元数据;4标记语言。参见:NISO发布入门读物《理解元数据》(2017-2-9)

新发现IFLA编目部“元数据方案使用工作组”2003年《数字资源和馆藏的元数据记录的结构、内容和应用指南》(草案),又是一种分类方法(详见后)。
Guidance on the Structure, Content, and Application of Meatdata Records for Digital Resources and Collections
Report of the IFLA Cataloguing Section, Working Group on the Use of Metadata Schemas
Draft – for Worldwide Review, 27 October, 2003
工作组成立于1998年IFLA年会上,1999-2003连续5年在IFLA年会上开会,最终形成了这个草案。不知什么原因停步于草案,没有如文件中希望的那样在2004年IFLA年会得到通过。
忘了在哪里看到这个IFLA文件了。因为是草案,在编目部的出版物和出版清单中没有,IFLA网站内搜索文件名也没有结果,只有搜索引擎可以查到这个在IFLA存档中的文件。

——— 通用元数据记录的类型或结构 ——-
本文件基于FRBR的用户任务(发现、识别、选择、获取),确定了10个核心元素,并与10种通用元数据方案作了映射(附录)。作为讨论的基础,在2.1节定义了6种元数据类型:
[1] 管理元数据:关于记录本身的“内务处理”信息 – 其创建、修改、与其他记录的关系等。元素如:记录号,记录创建日期,最后修改日期,记录创建者/修改者的标识,记录的语言,附注,本记录与其他记录的关系。
[2] 描述性元数据:描述数字项目或对象的物理和知识属性或内容的信息。元素如:题名,创建者,日期,出版者,唯一标识符,动态链接,摘要、描述性附注、评论等,受众层次,物理媒介、格式等,单件或对象的语言,版本。
[3] 分析元数据:分析和增强对资源内容的访问的信息。有时也称为“主题元数据”。元素如:受控主题词,主题/论题关键词,摘要、目次,分类代码、其他本地元素如所属部门、其他电子内容相关链接。
[4] 权利管理元数据:有关访问或使用数字单件或对象的限制(法律;财务等)的信息。元素如:使用限制,许可说明,订购/许可/每次使用费,致谢,版权声明,保留时间表,质量评级,使用免责声明。
[5] 技术元数据:用于将单项/对象转换为数字格式或存储、显示等的特定硬件或软件。元素如:数字化设备规格,相机位置,拍摄条件,编码参数,语音识别和/或回读硬件和软件,光学扫描仪规格,图像渲染设备,文件类型和转换软件要求
[6] 其他待定。例如,基于本地、区域和/或组织要求的特定元数据元素,或者根据国家规定的元数据标准,并且不包含在上面的任何元数据类型中。

——— 核心元素和常用元数据 ———
3.1节确定的核心元素
10个核心元素:主题,日期,使用条件,出版者,资源名称,语言/表达模式,资源标识符,资源类型,作者/创建者,版本

贯穿整个文件的元数据方案(从背景到附录)
10种元数据方案:MARC21,UNIMARC,DC,TEI,EAD,VRA,CSDGM/FGDC,CIMI,GILS,ONIX
其中:
CSDGM = Content Standard for Digital Geospatial Metadata(FGDC=美国联邦地理数据委员会,当前版本:Vers. 2 (FGDC-STD-001-1998))
CIMI = Consortium for the Interchange of Museum Information(始于1990,从wikipedia词条下网站链接看,大概率已经死掉了)
GILS = Government Information Locator Service [now Global Information Locator Service]

ALCTS网络课程:采访、编目、长期保存等

美国图书馆协会(ALA)下属图书馆馆藏与技术服务协会(ALCTS)正在推广其网络基础课程系列,目前面向发展中国家提供少量免费名额:2019年1-8月间每个课程、每次开课(session)1名。“发展中国家”的认定基于世界银行的“新兴经济体”(包含中国)和联合国的“最不发达国家”。申请日期2018.12.3-2019.1.2。详情见:
Online Course Grant for Library Professionals from Developing Countries 发展中国家图书馆专业人员在线课程补助金

网络课程共7门,每门课程4周或6周,原价$139(ALCTS成员)或$169(非成员)。2019年1-8月间开课2-3次不等。来自课程网页的概述如下(Online Learning > Fundamentals Web Courses):

采访基础(FOA)网络课程侧重于获取专著和连续出版物的基础知识:目标和方法,图书馆馆藏预算的财务管理,以及采访馆员、图书馆书商、订阅代理商和出版商之间的关系。在本课程中,您将获得在做出选择决定后,获取资料所涉及的操作的广泛概述。注意在FOA中,我们区分馆藏发展(涉及为图书馆选择资料) 和采访(订购、接收和支付这些资料)。

馆藏发展与管理基础(FCDM)网络课程涉及图书馆这些重要责任领域的基本组成部分。组成部分包括:馆藏发展和馆藏管理的完整定义;作为图书馆规划一部分的馆藏政策和预算;馆藏发展(选择和建设馆藏);馆藏管理(例如,在选择资料后做出决定,包括有关剔除、转移、长期保存的决定);馆藏分析——为什么以及如何做;延伸、外联和营销;关于馆藏发展和管理未来的趋势和建议。

长期保存基础(FOP)网络课程向学员介绍图书馆和档案馆长期保存的原则、政策和实践。本课程旨在为所有员工提供信息,包括各部门以及各级负责人员。它提供了开始延长图书馆馆藏使用寿命的工具。课程内容包括:长期保存作为正式的图书馆功能以及它如何反映和支持机构使命;预防护理(preventive care)的主要作用,包括良好的储存条件、应急计划和精心处理馆藏;物理格式的历史和制造以及它如何影响长期保存选择;护理和修复的标准方法,以及重新格式化选项;长期保护数字内容的挑战以及对学术未来的影响。

电子资源采访基础(FERA)网络课程将概述获取、提供、管理、支持和监控对电子资源的访问。它将提供电子资源采访的基本背景,包括产品试用、许可、购买方法和定价模型,并将概述供应商、出版商、平台提供商和图书馆之间有时复杂的关系。

馆藏评估基础(FCA)课程介绍了图书馆馆藏评估的基本方面。本课程专为那些对所有类型和规模的图书馆的馆藏评估负责或有兴趣的人设计。本课程将介绍馆藏评估的关键概念,包括馆藏评估的定义、技术和工具、印刷和电子馆藏评估以及项目设计和管理。

编目基础(FOC)网络课程首先讨论编目如何帮助用户发现资源以及实践标准化的价值。然后,这些基础在创建书目描述、主题分析过程和利用分类概括内容的工作中得到了实践基础。讨论了MARC书目和规范格式、美国国会图书馆主题标题和国会图书馆分类等标准。从FRBR基础到RDA实际应用,重点由基于格式的编目转移到实体-关系模型编目,最后看看RDF三元组和BIBFRAME。在所有领域,都说明和讨论标准的价值。在整个课程内容中,严重依赖实际实践中的示例。

元数据基础(FOM)课程将考察编目和元数据之间的相似点和不同点;描述、技术和管理元数据模式; 内容标准和受控词表;元数据创建和转换的方法;元数据项目设计。

RDA信息源升级版:数据出处

一、引言
信息源,指文献著录的依据。与曾经强调乃至细化信息源的规则不同,新RDA(测试版工具包)考虑到国际化,包容数据的多样性,体现在信息源方面就是弱化相关规则,只规定通用信息源,把各元素的信息源留给不同的编目社区自己制定,因而与原RDA相比,信息源相关规则既有形式也有内容上的变化。
在新RDA中,“信息源”被包含在“数据出处”中,元数据(记录)本身也成为元数据作品。特别值得注意的是,曾经很重要的“首选信息源”概念也将不复存在,“其他信息源”(载体表现以外的信息源)则被归入“载体表现不提供信息源”。其实虽然“首选信息源”在原RDA中出现频率不低,但在其术语表中也只有“信息源”,并没有“首选信息源”。
根据2018年RSC年会文件的说明,目前测试版上的RDA文本还不是稳定版,但内容已经得到确认,基本上不会有大的改动了。以下测试版工具包内容以2018年12月8日文本为准。

二、背景(官方文件)
2018年RSC年会成果文件(RSC/Outcomes/2018:Outcomes of the October 2018 RSC Meeting)上月底发布,信息源(Sources of information)在“RDA内容讨论”的“指引章节”中涉及,文字如下:
信息源。RSC重申其2017年马德里会议的决定,在RDA中提供有关信息源的一般性指示,而不是RDA规定一个优先顺序。特定社区的应用配置文件可以根据需要提供有关信息源的详细指导。在测试工具包中有关数据出处(Data provenance)的指引章节中提供了有关信息源的文本。
找来2017年RSC年会成果文件(RSC/Outcomes/2017 October: Outcomes of the October 2017 RSC Plus Meeting),在“3R计划:RDA内容变化”中这样说明:
关于如何选择信息源以及它们与出处(provenance)的关系,将删除每个元素中关于信息源的条款,以支持更高层次的一般指引。如果这对特定社区很重要,可以放在政策声明中。

三、数据出处与元数据作品
在测试版工具包的GUIDANCE(指引)菜单,有“数据出处”或“数据起源”(Data provenance)。根据术语表中的定义:
数据出处,指有关记录在元素或元素集中的元数据的信息,即有关元数据的元数据,或称元元数据(Information about the metadata recorded in an element or set of elements. Metadata about metadata, or metametadata.)。
【指引】数据出处所描述的元数据,被视为由一个元数据语句或一个元数据描述集所组成的元数据作品。可以使用任何适当的RDA元素和记录方法来描述元数据作品。【把元数据本身也当作(与LRM的其他作品)相同的作品,在概念与实践上都是突破。
(元数据作品)适用元素如下【11个】:
元数据的附注
发布元数据的施事者
记录元数据的施事者
用于元数据的内容标准
描述语言
元数据的有效范围
描述文字
元数据的来源
元数据的有效时段
元数据发布的时段
用于元数据的转录标准。

四、信息源: 元数据的来源
以上“数据出处”中的“元数据的来源”,即原RDA的信息源(Sources of information),目前的定义是:元素的数据值的来源(A source of a data value for an element)。
“记录元数据的来源”部分,包含原RDA 2.2 信息源的内容,但不再有“首选信息源”“其他信息源”的概念——从全文搜索看,后者结果为0,前者结果为3(均在选项中出现,估计在接下来的统稿过程中也会被修改)。
新RDA的“元数据的来源”大部分内容依“条件”(Condition)对原RDA 2.2 内容的重新排列组合,12个“条件”依次如下(括号内为对应的原RDA条款,方括号未找到原条款,似为新增):
载体表现由一个或多个页、叶、张或卡片组成(2.2.2.2)
早期印刷资源(2.2.2.2例外)
复制品(2.2.3.3)
缩微复制品(2.2.2.2交替)
动态图像(2.2.2.3)
缺少题名帧或题名屏的动态图像(2.2.2.3.1, 2.2.2.3.2)
其他(2.2.2.4)
包含多种语言文字的首选信息源(2.2.3.1)
非历时作品、提供2个及以上不同日期的首选信息源(2.2.3.2)
元数据说明或描述集的来源是被描述载体表现【元数据作品】
载体表现不提供信息源(2.2.4 其他信息源)
元数据说明或描述集的来源非被描述的载体表现【作品的相关载体表现】。
在“条件”下分列各自的“选项”(Option)。不同条件下的信息源与优先顺序不尽相同,粗看大致与原RDA相同。比如最常用的“载体表现由一个或多个页、叶、张或卡片组成”,选项内容如下:
依次选择以下信息来源:
题名页、题名张、题名卡片
与载体表现一同发行的封面或封套(cover or jacket)
标题(caption)
报头(masthead)
版权页(colophon)

五、载体表现各元素中的信息源
【指引】载体表现可以携带文本信息,该文本信息可以被转录或以其他方式用作载体表现本身的描述的信息源。转录值可以记录为以下一个或多个元素及其子元素和元素子类型的非结构化描述【按ISBD项重新排列】:
载体表现说明
题名说明、责任说明
版本说明
出版说明、发行说明、生产说明、制作说明
丛编说明。
在以上元素的非结构化描述中,涉及信息源的说明大致有3种(不含“选项”中涉及的信息源说明):
1、使用任何信息源(题名说明、版本说明、丛编说明)
2、记录转录来源见:Data provenance: Recording a source of metadata.【即上述“四”中各“条件”的“选项”】(载体表现说明,出版、发行、生产、制作说明)
3、未提及信息源(责任说明)
基本上就是“删除每个元素中关于信息源的条款”的明证了。对最重要的载体表现题名,竟然“Use any source of information”!没有政策声明或本地应用配置文件/应用纲要,还真没法用了?

新RDA变化,参见:
RDA进展:3R计划预计2019年底完成 (2018-12-1)
RDA未来几个月的内容变化(来自2018 RSC年会)(2018-12-1)
RDA著录方式新框架:资源描述(2018-12-6)