RDA信息源升级版:数据出处

一、引言
信息源,指文献著录的依据。与曾经强调乃至细化信息源的规则不同,新RDA(测试版工具包)考虑到国际化,包容数据的多样性,体现在信息源方面就是弱化相关规则,只规定通用信息源,把各元素的信息源留给不同的编目社区自己制定,因而与原RDA相比,信息源相关规则既有形式也有内容上的变化。
在新RDA中,“信息源”被包含在“数据出处”中,元数据(记录)本身也成为元数据作品。特别值得注意的是,曾经很重要的“首选信息源”概念也将不复存在,“其他信息源”(载体表现以外的信息源)则被归入“载体表现不提供信息源”。其实虽然“首选信息源”在原RDA中出现频率不低,但在其术语表中也只有“信息源”,并没有“首选信息源”。
根据2018年RSC年会文件的说明,目前测试版上的RDA文本还不是稳定版,但内容已经得到确认,基本上不会有大的改动了。以下测试版工具包内容以2018年12月8日文本为准。

二、背景(官方文件)
2018年RSC年会成果文件(RSC/Outcomes/2018:Outcomes of the October 2018 RSC Meeting)上月底发布,信息源(Sources of information)在“RDA内容讨论”的“指引章节”中涉及,文字如下:
信息源。RSC重申其2017年马德里会议的决定,在RDA中提供有关信息源的一般性指示,而不是RDA规定一个优先顺序。特定社区的应用配置文件可以根据需要提供有关信息源的详细指导。在测试工具包中有关数据出处(Data provenance)的指引章节中提供了有关信息源的文本。
找来2017年RSC年会成果文件(RSC/Outcomes/2017 October: Outcomes of the October 2017 RSC Plus Meeting),在“3R计划:RDA内容变化”中这样说明:
关于如何选择信息源以及它们与出处(provenance)的关系,将删除每个元素中关于信息源的条款,以支持更高层次的一般指引。如果这对特定社区很重要,可以放在政策声明中。

三、数据出处与元数据作品
在测试版工具包的GUIDANCE(指引)菜单,有“数据出处”或“数据起源”(Data provenance)。根据术语表中的定义:
数据出处,指有关记录在元素或元素集中的元数据的信息,即有关元数据的元数据,或称元元数据(Information about the metadata recorded in an element or set of elements. Metadata about metadata, or metametadata.)。
【指引】数据出处所描述的元数据,被视为由一个元数据语句或一个元数据描述集所组成的元数据作品。可以使用任何适当的RDA元素和记录方法来描述元数据作品。【把元数据本身也当作(与LRM的其他作品)相同的作品,在概念与实践上都是突破。
(元数据作品)适用元素如下【11个】:
元数据的附注
发布元数据的施事者
记录元数据的施事者
用于元数据的内容标准
描述语言
元数据的有效范围
描述文字
元数据的来源
元数据的有效时段
元数据发布的时段
用于元数据的转录标准。

四、信息源: 元数据的来源
以上“数据出处”中的“元数据的来源”,即原RDA的信息源(Sources of information),目前的定义是:元素的数据值的来源(A source of a data value for an element)。
“记录元数据的来源”部分,包含原RDA 2.2 信息源的内容,但不再有“首选信息源”“其他信息源”的概念——从全文搜索看,后者结果为0,前者结果为3(均在选项中出现,估计在接下来的统稿过程中也会被修改)。
新RDA的“元数据的来源”大部分内容依“条件”(Condition)对原RDA 2.2 内容的重新排列组合,12个“条件”依次如下(括号内为对应的原RDA条款,方括号未找到原条款,似为新增):
载体表现由一个或多个页、叶、张或卡片组成(2.2.2.2)
早期印刷资源(2.2.2.2例外)
复制品(2.2.3.3)
缩微复制品(2.2.2.2交替)
动态图像(2.2.2.3)
缺少题名帧或题名屏的动态图像(2.2.2.3.1, 2.2.2.3.2)
其他(2.2.2.4)
包含多种语言文字的首选信息源(2.2.3.1)
非历时作品、提供2个及以上不同日期的首选信息源(2.2.3.2)
元数据说明或描述集的来源是被描述载体表现【元数据作品】
载体表现不提供信息源(2.2.4 其他信息源)
元数据说明或描述集的来源非被描述的载体表现【作品的相关载体表现】。
在“条件”下分列各自的“选项”(Option)。不同条件下的信息源与优先顺序不尽相同,粗看大致与原RDA相同。比如最常用的“载体表现由一个或多个页、叶、张或卡片组成”,选项内容如下:
依次选择以下信息来源:
题名页、题名张、题名卡片
与载体表现一同发行的封面或封套(cover or jacket)
标题(caption)
报头(masthead)
版权页(colophon)

五、载体表现各元素中的信息源
【指引】载体表现可以携带文本信息,该文本信息可以被转录或以其他方式用作载体表现本身的描述的信息源。转录值可以记录为以下一个或多个元素及其子元素和元素子类型的非结构化描述【按ISBD项重新排列】:
载体表现说明
题名说明、责任说明
版本说明
出版说明、发行说明、生产说明、制作说明
丛编说明。
在以上元素的非结构化描述中,涉及信息源的说明大致有3种(不含“选项”中涉及的信息源说明):
1、使用任何信息源(题名说明、版本说明、丛编说明)
2、记录转录来源见:Data provenance: Recording a source of metadata.【即上述“四”中各“条件”的“选项”】(载体表现说明,出版、发行、生产、制作说明)
3、未提及信息源(责任说明)
基本上就是“删除每个元素中关于信息源的条款”的明证了。对最重要的载体表现题名,竟然“Use any source of information”!没有政策声明或本地应用配置文件/应用纲要,还真没法用了?

新RDA变化,参见:
RDA进展:3R计划预计2019年底完成 (2018-12-1)
RDA未来几个月的内容变化(来自2018 RSC年会)(2018-12-1)
RDA著录方式新框架:资源描述(2018-12-6)

RDA著录方式新框架:资源描述

Description作为编目专业术语,曾经译为“著录”,现在也常称“描述”,如同RDA中译名《资源描述与检索》。曾经著录方法分为:综合著录、分析著录、层次著录。在RDA工具包测试版网站的新RDA中,构建“资源描述”(Resource description)即“信息资源描述”的基本指导和说明分成以下3种:
连贯描述(Coherent description of an information resource):针对信息资源的良好描述所需的实体和元素
– 最低描述(Minimum description of a resource entity):针对资源实体的良好描述所需的元素
有效描述(Effective description):符合编目机构或本地应用要求的良好描述
由于对RSC年会成果(Outcomes of the October 2018 RSC Meeting)的误读,先前以为这3种描述是原来3种著录方法的改名。仔细看测试版工作包,实际是完全换了一种思路——所谓的新框架,完全基于WEMI:资源描述的实体(资源实体),即《IFLA图书馆参考模型》(IFLA LRM)的作品实体、内容表达实体、载体表现实体(出版载体表现和未出版载体表现)和单件实体。
参见:RDA未来几个月的内容变化(来自2018 RSC年会)(2018-12-1)

1、信息资源的“连贯描述”,揭示LRM的层次关系,对应于原RDA第5部分“记录WEMI间主要关系”(含第17章),使用的实体及其元素为(末尾数字为原RDA条款号):
* Item: manifestation exemplified(基数最小=1,最大=1) 17.12
* Manifestation; exemplar of manifestation(基数最小=1,最大=不限) 17.11
* Manifestation: work manifested 17.8
* Manifestation: expression manifested(基数最小=1,最大=不限)17.10
* Expression: manifestation of expression(基数最小=1,最大=不限)17.9
* Expression: work expressed(基数最小=1,最大=1)17.6
* Work: expression of work(基数最小=1,最大=不限)17.5
* Work: manifestation of work 17.7
以上关系元素用于关联描述不同信息资源的实体时,没有数量限制,括号中的基数针对单个信息资源的连贯描述。
连贯描述的最低要求:包括至少一个实体,记录至少一个称谓元素(appellation)的值(记录方法不限)。
【思考:其实是要求揭示实体本身之外的关系。如手头文献(载体表现)描述《石头记》,按连贯描述,1可记录17.8载体表现的作品:作品的题名=红楼梦;2可记录17.11载体表现例证(馆藏):单件的条码=…,3可记录17.10载体表现的内容表达……。当然也可以只记录其中的1个,以往来说最常见的是馆藏,但从以下“最低描述”看,要求的反而是内容表达或作品

2、资源实体的“最低描述”,规定每种实体必须提供的最低元素。总结下来就是:称谓+最少关系。
– 作品【称谓,1-2个主要关系】
作品的称谓,可以用:作品题名(首选题名)、作品检索点(规范检索点)、作品标识符
作品的内容表达【取值略,类似“作品的称谓”(下同)】或 作品的载体表现【取值略】
– 内容表达【称谓,2个主要关系】
内容表达的称谓,可以用:内容表达题名(首选题名)、内容表达检索点(规范检索点)、内容表达标识符
内容表达的作品【取值略】
内容表达的载体表现【取值略】
– 载体表现【称谓,1-2个主要关系】
载体表现的称谓,可以用:载体表现题名(正题名)、载体表现检索点(规范检索点)、载体表现标识符
载体表现的内容表达【取值略】或 载体表现的作品【取值略】
– 单件【称谓,1个主要关系】
单件的称谓,可以用:单件题名(首选题名)、单件检索点(规范检索点)、单件标识符
例证的载体表现【取值略】
思考:称谓(LRM的nomen)可用来代表实体,可以是题名(非结构化描述)、检索点(结构化描述)、标识符,也可以是IRI(在被忽略掉的取值中,有的选项有IRI)】

3、有效描述(Effective description)即符合上述信息资源的连贯描述要求,并且其中实体至少有一个符合上述最低描述要求。
可以在此基础上添加其他元素,使用时依据:
* Application profiles 应用配置文件/应用纲要
* Policy statements 政策声明
* Cataloguer’s judgement 编目员判断
* Availability of information 信息可获得性
【思考:对数据元素的要求真的很低!大家可以贡献不同的数据元素,通过IRI关联在一起,形成一个“完整”的数据集,然后各取所需?】

RDA未来几个月的内容变化(来自2018 RSC年会)

2018年RSC年会今年10月22-26日在加拿大蒙特利尔举行,会议成果11月27日发布:
RSC/Outcomes/2018:Outcomes of the October 2018 RSC Meeting

其中的“RDA内容讨论”部分,涉及RDA将会有变化的部分,值得特别关注。由于“稳定RDA英文文本”计划在2019年4月完成,这些变化当会在此前确定。
以下为摘译(编号为本人添加),补充了来自RSC候任主席上月某次在线会议报告的内容:
Kathy Glennan. Evolution of the RDA Toolkit and its Impact on Catalogers. AMIGOS Online Conference “The Future of Cataloging: RDA, Linked Data and More!”, 2018-11-08.

一、指引章节(Guidance)
1、合集和历时作品(Aggregates and diachronic works)。待进一步开发指引、细化术语,实体章节相关条款也有待审核调整。对连续出版物有重要影响。
2、应用配置文件(Application profiles)
RDA工具包支持多种方法创建应用配置文件:(1)工具包机构帐户的书签和注释,链接到元素或条款;(2)工作流程等工具包内部文件,本地或全域共享;(3)工具包外部文件,如需要可链接到工具包;(4)应用配置文件与政策声明集成。
RSC将实验开发一个高层RDA应用配置文件,基于“核心”元素理念(不过“核心”与“条件核心”标识将不作为RDA条款的一部分提供)。
3、新框架【著录(描述)方法改名】
综合著录->最小描述 comprehensive description -> minimal description
分析著录->有效描述 analytical description-> effective description
层次著录->连贯描述 hierarchical description -> coherent description
详见:Guidance — Resource description
4、一般指引。需要更完整、更多指引,文本将扩充、明确。
5、非人类角色。考虑为每个RDA实体增加一个高层元素,解决“个人”定义不含非人类角色问题。
6、信息源。再次确认2017马德里会议决定,在RDA中提供一个信息源的通用条款,而不再规定优先顺序。特定社区的应用配置文件可以在需要时提供有关信息源的详细指引。
信息源文本在: Guidance — Data provenance【新引入概念】
7、用户任务。每个元素的“元素参考”移除“用户任务”部分,因为几乎所有元素都支持所有用户任务。将代之以指引的一个章节。

二、实体章节(Entity)
1、检索点元素。RSC在2017马德里会议上同意检索点应该成为RDA中的元素,这意味着拆解名称/首选名称/变异名称(或题名)元素的复杂条款。Thomas Brenndorfer(RSC北美代表)对此进行了分析,RSC将进行评估。
3层:(1)检索点[载体表现、个人、地点等];(2)规范检索点[内容表达、施事者agent、时段等];(3)变异检索点[作品、团体等]
2、元素标签。修改:(1)含etc.标签,避免包含标点;(2)去除other;(3)需要澄清designation含义。
3、新元素。(1)内容表达“版本”(version);(2)施事者(Agent)关系元素的元素子类型;(3)适用描述历时作品和合集的元素。
4、关系说明语->关系元素。原附录I、J、K、M的关系说明语现在为元素,提供两个实体间关系。见:Resources — Relationship Matrix。编目员可以为重要但细粒度资源【作为实体】创建单独的描述。
5、软弃用元素。工具包测试版中保留了某些准备弃用的【冗余】元素,特征是包含文本“The following option is preferred”,指向首选元素【即新RDA采用的元素】。
【在工具包测试版中带引号查”The following option is preferred”有89个结果,大致包括3类元素:(1) details of(代之以元素本身的非结构化描述);(2) parallel(代之以重复同样元素——即不再定义并列元素);(3) note on(代之以所属实体的附注,如题名附注->载体表现附注)。不是用新元素代替旧元素,而是指向已有的、较泛指的元素】

关于RDA内容变化,参见:RDA已经发生和有待发生的变化(2018年6月3R计划成果)(2018-6-21)
关于2018年RSC年会,参见:RDA进展:3R计划预计2019年底完成(2018-12-1)