PCC《元数据创建的多样、公平和包容的指导原则》

之前介绍美国合作编目项目的“PCC 2023-2027战略方向”(2023-3-24),指出新动向第1条,就是:

  • 多样、公平和包容(diversity, equity and inclusion,简称DEI),这是美国近年最重要的“政治正确”。除在使命(Mission)中提DEI外,专设SD6,与残障友好的“可及”合并称ADEI(Accessibility, Diversity, Equity and Inclusion),并说明其他SD也体现ADEI原则。

后来发现,2023年初PCC还单独批准了《元数据创建的多样、公平和包容的指导原则》。真正感觉到形势的强大。全文翻译附后,备记。

其中提到的《编目伦理守则》,全文翻译可参见:

—— 元数据创建的多样性、公平性和包容性指导原则 ——

Guiding Principles for Diversity, Equity, and Inclusion for Metadata Creation (2023-1-19)

批准日期:2023年1月19日

背景

PCC政策委员会(PoCo)于2020年11月同意在其现有战略规划中增加一个新的战略方向,将多样、公平和包容(DEI)原则纳入PCC运营的各个方面,并使DEI和元数据伦理成为PCC工作的一个组成部分。PCC认可编目伦理指导委员会起草的《编目伦理守则》(最终版本-2021年1月),并为PCC成员提供以下原则(松散地基于该守则),作为将DEI原则应用于其编目和元数据工作的重点指南。

元数据创建的指导原则

PCC成员:

1.在考虑最终用户的情况下描述我们收藏的资源,以便于访问和促进发现,同时尊重这些资源的相关行为者的隐私和偏好。

2.与用户社区合作,了解他们的需求,尤其是与DEI问题相关的需求。

3.承认我们使用的标准和受控词表及其应用存在偏见,批判性地对待其开发和应用,并提倡使编目和资源描述更具包容性。

4.对我们的元数据负责,并倡导我们的合作和机构实践和政策的透明度。

5.广泛合作,支持在各种环境和管辖地中创建、分发、维护和丰富公平和包容的元数据。

6.倡导在编目工作的各个方面纳入DEI原则的重要性。

PCC 2023-2027战略方向

PCC Strategic Directions, 2023-2027 (March 9, 2023)

《PCC战略方向,2023-2017》最新发布。前几次可参见:

没有和前几次的战略规划/战略方向细致对照,仅就感觉粗略查了下,以下几点或可视为新动向:

1、多样、公平和包容(diversity, equity and inclusion,简称DEI),这是美国近年最重要的“政治正确”。除在使命(Mission)中提DEI外,专设SD6,与残障友好的“可及”合并称ADEI(Accessibility, Diversity, Equity and Inclusion),并说明其他SD也体现ADEI原则。

  • 在编目(元数据)领域,主题词表特别容易有这方面的问题。6.5专述此方面行动,术语“批评编目”(critical cataloging)“修复编目/描述”(reparative cataloging/description)

2、技术多元化(pluralism)。前些年强调关联数据、目标是替换现有元数据实践,现在则强调技术多元、即新旧并存,认可MARC有相当长的过渡期。当然,关联数据的发展方向并未改变。

  • 5个行动:2.1映射;2.2身份/实体管理,URI、协调服务(reconciliation services);2.3 RDA,政策声明、元数据指导文件等;2.4更多词表;2.5 MARC改进:主动废止重复和/或未充分利用的元数据编码做法(例如,在MARC记录的其他地方重复信息的固定字段);在废止不可行时,鼓励开发元数据编辑工具,最大限度地减少重复的人工数据输入。

3、Share-VDE(虚拟发现环境),Share Catalog进化而来的联机目录,应用BIBFRAME。转换到关联数据/BIBFRAME之后,PCC需要联合目录库,这就是PCC数据池,采用Share-VDE。相关博文:https://catwizard.net/page/6?s=share+vde

4、编目减员严重,希望招募(图书馆外的)元数据从业者和LIS研究生参与PCC项目。

此外,由文件可见PCC的各种委员会,6个战略方向(SD)有各自的具体行动(Actions),分别由一个或多个委员会承担:

  • 政策委员会 PoCo(Policy Committee)
  • 标准常设委员会 SCS(Standing Committee on Standards)
  • 应用常设委员会 SCA(Standing Committee on Applications)
  • 培训常设委员会 SCT(Standing Committee on Training)
  • 关联数据咨询委员会 LDAC(Linked Data Advisory Committee)
  • 身份管理咨询委员会 IMAC(Identity Management Advisory Committee)
  • 多样公平包容咨询委员会 DEIAC(Diversity, Equity and Inclusion Advisory Committee)

—— PCC 2023-2027战略方向 ——

以下为6个SD(战略方向),省略其下具体行动(Actions)。

  • SD1:与更广泛的元数据利益相关者社区接触

随着PCC在其历史上面向内部和MARC 21的重点之外采取进一步措施,它必须在一致的基础上与更广泛的社区接触。近年来,它已经开始与ISNI(国际标准名称标识符)、Share-VDE(共享虚拟发现环境)和其他社区建立合作伙伴关系,并尝试和试行超越历史MARC限制的重新构想的元数据实践。在接下来的几年里,PCC必须加强努力,与符合其目标的其他组织合作。这包括GLAM(画廊、图书馆、档案馆和博物馆)元数据社区,以及非GLAM和供应商社区。此外,用户体验(UX)因素必须成为图书馆元数据规范未来发展的驱动因素。PCC必须采取积极主动的措施,打破功能竖井/谷仓,更直接地满足我们所描述的资源用户的发现需求。

  • SD2:促进技术多元化和持续相关性的文化【关联数据与MARC并存】

近年来,图书馆元数据实践开始多样化,一些机构采用关联数据技术,而另一些机构在可预见的未来将在很大程度上保留基于MARC的工作流程。并非所有机构都能或希望在这一过渡期以同样的速度接受新技术,但PCC必须欢迎新兴实践的早期采用者和既定实践的维护者的参与并支持他们的需求。在这个技术多元化和人们对关联数据原则越来越感兴趣的时代,元数据的可共享性至关重要。PCC应在未来几年集中精力促进元数据的互操作性,并继续淡化虚幻的“完美”书目或规范记录的化妆品方面。一个相关的、可持续的合作项目是指我们的集体智力和增值工作得到尽可能有效和可扩展的利用。

  • SD3:增强合作项目的活力【招募(图书馆外的)元数据从业者和LIS研究生参与PCC项目】

随着编目/元数据部门因退休和自然减员而持续缩减,(当前和未来)PCC参与者的人才库受到负面影响。PCC有着通过其漏斗计划邀请更广泛的贡献者参与的既定记录,与正式机构成员相比,漏斗计划已经通过降低生产要求降低了进入门槛。也就是说,由于元数据工作的性质正在演变,PCC仅根据MARC记录统计来衡量贡献已经没有意义了。此外,PCC应该加倍努力,招募更大、更多元化的人才库,他们不仅能够通过元数据制作做出贡献,而且也可以在PCC的组织结构中任职。通过这样做,PCC将有助于培养未来几代的领导者。

  • SD4:变换PCC形像

PCC在编目和元数据专业知识以及高质量MARC元数据的生产方面建立了坚实的声誉。然而,其许多最活跃的成员来自少数(大多规模较大、人员配备充足、资金充足)机构。因此,来自较小和/或更专业机构的同事,以及来自美国、加拿大和英国以外机构的同事可能认为自己没有体现在PCC的目标中。此外,如上文SD2所述,近年来,图书馆元数据实践已开始多样化,一些机构采用关联数据技术,而另一些机构在可预见的未来将在很大程度上保留基于MARC的工作流程。PCC必须被视为一个“大帐篷”,在这里,专业知识、可培训性和为集体利益工作的意愿比机构“血统”更重要,是成为成员和领导的先决条件。PCC本身的关注点不断扩大,也为重塑其形象和品牌提供了机会。它的四个组成项目植根于MARC记录制作,但PCC的工作不再局限于这些核心活动。现在是PCC重新考虑如何在更广阔的世界中最好地代表自己的时候了。

  • SD5:评估和改进PCC存储和共享知识的方式【文档保存,版本控制、档案价值;推广使用,不同访问方式;交互式学习+自我评估+寻求帮助】

PCC拥有强大的集体智慧和记忆力,在考虑未来的政策和优先事项时,它经常被要求利用这些智慧和记忆力。保存和管理这些丰富的知识有时很难。PCC网站(由国会图书馆PCC秘书处维护)最近补充了一个(可协作编辑)wiki,可用于组织更短暂的知识。为了优化这一环境,现在需要进行有意的全面评估。其次,PCC的集体记忆主要保存在Word和PDF文档中。由于该信息的索引和组织不一致,因此该信息的存档价值存在漏洞。展望未来,PCC应探索多种方法,不仅为了子孙后代的利益,保留其关于图书馆元数据实践的长期知识,而且为多元文化和多语言受众有效地打包当前内容。随着元数据实践本身的不断多样化,围绕这些实践传递技能和知识的方法也必须多样化,以跟上当今的可访问性和可用性规范。

  • SD6:通过可及、多样、公平和包容(ADEI)原则来评估和改进PCC的运作【新成立DEI咨询委员会】

作为其上一个战略计划的一部分,PCC委托成立了一个新的多样公平包容咨询委员会(DEIAC)。该小组已经在PCC运营的所有领域推进ADEI理想方面取得了重大进展。随着该小组的成熟和继续开展工作,PCC将出现一种新的文化和运营模式。必须不断评估和更新这一范式,以跟上全球ADEI工作的快速发展。因此,这一战略方向是对先前工作的延续和加强,而不是一个全新的领域。本文件中描述的其他战略方向也包括适用的ADEI原则。

RDA元数据指导文档(MGD):作品、内容表达(命名、新旧变化)

RDA元数据指导文档(MGD)是美国官方RDA政策声明(LC-PCC PS)的配套文件,为某些实体、属性与关系提供详细的说明与使用指导。

参见:

叙述性MGD共20个,去年写了如上2个,本篇概述另2个即作品和内容表达。关注新旧RDA的差异,以及这2个实体涉及的Nomen(命名)——新实体Nomen及属性没有专门的MGD文档。

——Nomen实体——

【定义】除Nomen本身外,任何RDA实体的标签,包括名称、题名、检索点或标识符。

主要是作为其他实体的取值/值域(range)而存在。在没有Nomen实体时,很多元素是其他实体的属性;有了Nomen,就成为其他实体与Nomen之间的关系。

Nomen作为实体,通常作为检索点,受某种规则约束,或者直接取值于某个数据库或受控词表。

【作品MGD中的Nomen】

作品的检索点、作品的规范检索点、作品的变异检索点,作品的题名、作品的首选题名、作品的变异题名,作品的标识符,作品的称谓,[连续出版物] 识别题名(key title)、ISSN,[音乐] 音乐数字标识(numeric designation)、音乐作品序号(serial number),作品编号(opus number)、作品号(thematic index number)。【不懂音乐,不知道中译名】

【内容表达MGD中的Nomen】

内容表达的检索点、内容表达的规范检索点、内容表达的变异检索点,内容表达的题名,内容表达的首选题名、内容表达的变异题名,内容表达的标识符。

——MGD:作品——

(除以下叙述性MGD,作品另有十多个一对一MGD,涉及作品的检索点、附注,以及学位论文信息、频率)

【定义】作品是一种抽象实体,被定义为“独特的智力或艺术创作,即智力或艺术内容”。

【组成类型】作品可以指单个作品、作品的一部分、集合作品、历时作品、元数据作品、连续[出版物]作品、单个作品或静态作品。

【内容类型】当作品按其预期内容或背景分类时,可称为制图作品、舞蹈作品、法律作品、动态图像作品、音乐作品、实物作品、官方通讯、摄影作品、宗教作品、静态图像作品、文本作品或声乐作品。

【新建记录】见“作品:实体边界”以获取RDA条款及LC-PCC PS,以确定是否正在描述新作品。【参见:RDA新章:实体边界(2020-10-3)https://catwizard.net/posts/20201003112901.html;RDA应用纲要和实体边界(2022-1-7)https://catwizard.net/posts/20220107170156.html

【属性和关系(略)】作品的元素(属性和关系),按值域排列,从命名、属性(即无值域元素)开始、再后其他实体,最后为描述元数据作品的元素(元数据作品附注、记录来源、有效范围、参考源)。含《描述性编目手册》(DCM)Z1名称和丛编规范记录,以及规范数据MARC 21格式的LC指南补充。不包括LC/PCC未使用元素;不包括集合作品、手稿、连续作品或丛编(有其他指导文件)。

【新旧RDA变化】(14条)

[1]原RDA:作品题名中可以省略首冠词

(RDA 6.2.1.7)。官方RDA:首冠词始终保留在作品题名中,但可以从作品检索点中删除。【不排序字符】

[2]原RDA:作品的其他区别特征是元素(RDA 6.6),可记录为单独的元素,或作为检索点的一部分,或两者。官方RDA:包括作为作品区别特征的标识是作品检索点中附加元素和标识的“选项”;区别特征可记录为作品附注。【可选+附注】

[3]原RDA:表演媒介(RDA 6.15)是作品属性。官方RDA:音乐内容的表演媒介是内容表达属性;代表性内容表达的音乐内容的表演媒介可以被记录为作品的属性。【音乐:作品属性->内容表达属性(代表性内容表达的属性=作品的属性)】

[4]原RDA:调key(RDA 6.17)是作品的属性。官方RDA:内容表达的调是内容表达的属性;代表性内容表达的调可以记录为作品的属性。【音乐:作品属性->内容表达属性】

[5]原RDA:管辖地(RDA 6.21.1.4)是作品的属性。在描述法律作品时,记录受另一司法管辖区颁布的法律、法规等管辖的司法管辖区(即团体)。官方RDA:管辖地是团体和地点之间的关系。在描述政府(即团体)时,记录该政府颁布的法律、法规等管辖的司法管辖区(即地点)。【属性变关系】

[6]原RDA:目标受众(RDA 7.7)是作品的属性。官方RDA:内容表达的目标受众是内容表达的属性;代表性内容表达的目标受众可被记录为作品的属性。 【作品属性->内容表达属性】

[7]原RDA:作品检索点没有通用元素。官方RDA:作品检索点的新元素,包括用于构建用于作品的规范检索点和用于作品的变异检索点的一般说明。

[8]原RDA:为作品(RDA 6.27)、音乐作品(RDA6.28)、法律作品(RDA6.2 9)、宗教作品(RDA6.30)和官方通信(RDA 6.31)构建检索点的具体说明。官方RDA:检索点是使用编目社区特有的字符串编码方案构建的;作品检索点的RDA元素包括基本说明;英美资源遗产指南位于资源>社区资源>社区细化>作品细化。【特定类型作品的检索点->社区资源

[9]原RDA:记录音乐作品(RDA 6.14)、法律作品(RDA6.19)、宗教作品(RDA6.23)和官方通讯(RDA6.26)的题名的具体说明。官方RDA:英美资源遗产指南位于资源>社区资源>社区细化>作品细化。【特定类型作品的题名->社区资源

[10]原RDA:ISSN(RDA 2.15)、ISSN系列(RDA 2.12.8)和ISSN子系列(RDA2.12.16)的单独元素作为载体表现属性。官方RDA:ISSN元素用于记录ISSN、系列ISSN和子系列ISSN,它是作品和命名之间的关系元素。【连续出版物:载体表现属性->作品和命名关系】

[11]原RDA: 频率(RDA 2.14)是载体表现的属性。官方RDA:频率是作品的属性。【连续出版物:载体表现属性->作品属性】

[12]原RDA:识别题名key title(RDA 2.3.9)是载体表现属性。官方RDA:识别题名是作品和命名之间的关系元素。【连续出版物:载体表现属性->作品和命名关系】

[13]原RDA:参考源(RDA 5.8、8.12、24.7、29.6)是属性元素,它引用了参考源、来源中的位置以及找到的信息的简短陈述。官方RDA:参考源是(元数据)作品和载体表现之间的关系元素;只记录载体表现的称谓或IRI。【属性->关系】

[14]以上未列出的其他元素,已从原RDA属性更改为官方RDA中关系元素。【更多:属性->关系(附注->检索点)】

【连续出版物说明(以上10-12):原RDA的载体表现属性,在官方RDA成为作品属性或作品与命名间关系,原因是《IFLA图书馆参考模型》(LRM)的WEM锁定,即“任何的连续作品都只有一个内容表达和一个载体表现。连续出版物之间的所有关系都可建模为作品和作品的关系”。参见:IFLA-LRM的连续性资源模型对RDA修订的影响(2018-6-29)https://catwizard.net/posts/20180629215026.html

——MGD:内容表达——

【定义】内容表达是以字母数字、音乐或舞蹈符号、声音、图像、物体、运动等形式或这些形式的任何组合,对作品进行智力或艺术实现。

【属性与关系(略)】先列与命名相关的元素,然后是与实体无关但由编目员转录或记录的属性元素,许多与特殊格式相关【不同的内容类型】,其后其他实体。

【代表性内容表达】目前LC/PCC尚未为代表性内容表达元素(为作品元素)制定任何政策。

【新RDA变化】(3条)

[1]原RDA:无对应。官方RDA:代表性内容表达。

[2]原RDA:无对应。官方RDA:集合内容表达。【参见上引:合集】

[3]原RDA:RDA17.10-17.12被载体表现的内容表达/示例化的载体表现。官方RDA:Expression manifested/Manifestation of expression(同),明确提及为“快捷方式”(Shortcuts,直接关联两个RDA实体而不记录中间实体或关系的关系元素)。