RDA元数据指导文档(MGD):虚构和真实非人类实体

《IFLA图书馆参考模型》(LRM)规定,虚构的或非真实的实体不属于通常所属的类型。包括:

  • 虚构人物和非真实人类实体不属于“个人”(Person),见LRM-E7的范围注释:“个人实体仅限于有生命或认为有过生命的真实个人”。“一般认为是虚构的(如科米蛙)、文学性的(如简·马普尔小姐)或纯粹传说性质的(如巫师梅林)人物不是实体个人的实例”。
  • 非真实的地点不属于“地点”(Place),见LRM-E10的范围注释:“想象的、传说中的或虚构的地点不是地点实体的实例”。

这些实体被归入最宽泛的类型“资源”(Resource),非人类实体(如动物)也如此。见LRM-E1的范围注释:“资源是明确定义的所有其他实体的超类,以及没有明确标记的任何其他实体的超类”。样例:

  • {Miss Jane Marple} [阿加莎·克里斯蒂(Agatha Christie)多部小说和故事中的人物]
  • {Earthsea} [一个虚拟的世界,厄修拉·K·勒古恩(Ursula K. Le Guin)创作的《地海三部曲》(Earthsea trilogy)的背景]
  • {Pal} [1940年6月4日-1958年6月在世,一只雄性粗毛牧羊犬,1943年至1954年在电影中出演灵犬莱西(有几只帕尔的后代在后来的影视作品中也扮演了灵犬莱西)]

《资源描述与检索》(RDA)遵循LRM,作品的责任只能归于真实的人类或集体行为者。在新RDA的指南部分有“Fictitious and non-human appellations”(虚构和非人类称谓),在载体表现中作为责任说明出现时:对虚构实体,其称谓被假定是行为者、集体行为者、团体、家族或个人的化名称谓[假名、笔名等];对非人类实体,则视为RDA外部的实体。指南介绍了不同条件与选项下使用的RDA元素,但如果落实到MARC记录中会怎么样?

参见:RDA元数据指导文档(MGD):掌握新RDA(2022-9-10)

Official RDA Toolkit LC-PCC Metadata Guidance Document: Fictitious and Real Non-Human Entities [PDF, 233KB, 5页]
RDA元数据指导文档(MGD)的《虚构和真实非人类实体》,提供了LC-PCC的新RDA做法(2022年9月尚未实施),包括MARC和BIBFRAME示例。

  • 简单地说,MARC做法基本照旧

规范记录照旧:“将继续在NAF [名称规范档] 中建立虚构人物和真实的非人类实体的名称规范记录(NAR)”。特别强调提供“实体类型名称”,放在原就有且常用的100$c(头衔和其他相关词):“PCC正在开发用于这些非RDA行为者的实体类型词表”。

书目记录照旧:“根据需要,虚构人物和真实的非人类实体可以在书目记录中创作作品”。

看上去主要变化是:规范和书目记录的040$e(编目来源之描述规则)采用新代码pccrda,而不是rda。“表明这些记录符合PCC对RDA的实施”(换言之,这些是非RDA记录)。本MGD在概述中说,书目记录的描述规则代码未定,但示例中采用了相同新代码。

  • 至于BIBFRAME,似乎完全不涉及这个问题:“将Nomen实例的IRI记录为真实世界对象[RWO]”。换言之,不区分虚构、真实非人类实体,和人类一样,都是RWO。

RDA元数据指导文档(MGD):掌握新RDA

美国为实施新RDA所做准备工作,在更新政策声明(LC-PCC PS)之外,还有一个新子项目“元数据指导文档”(Metadata Guidance Documentation, MGD)。MGD于2022年1月31日完成,3月14日发布。

【什么是MGD】

MGD文档提供详细的说明和示例,扩展RDA工具包和LC-PCC PS中的说明。将官方RDA工具包与LC-PCC PS和MGD结合使用,将能有助于在新的RDA时代完成编目工作。(via Official RDA Metadata Guidance Documentation (MGD) Posted, 2022-3-14)

MGD“结合LC-PCC PS提供描述性编目指南和示例,并帮助编目员在新RDA说明和术语更改下工作”;“充当从原RDA到官方RDA 的‘桥梁’文件;一旦PCC社区更加熟悉官方RDA及其支持文档的结构和语义,就可以开始对MGD进行更改。”(详见:LC RDA Project Summary and Update, 2022-1)

MGD不是独立的文件,必须与官方RDA工具包和LC-PCC PS一起使用。LC-PCC PS可以链接到对应的MGD。

【为什么需要MGD】

因为新RDA(官方RDA工具包)中的政策声明(PS)只是对选项的应用决策(采用、不采用、编目员判断等),更详细的具体用法等信息需要使用MGD。MGD由美国国会图书馆、合作编目项目(PCC)和大英图书馆合作完成(因此反映的是英美编目实践)。

(以下信息取自MGD引言(Metadata Guidance Documentation (MGDs) Introduction))

  • 官方RDA的架构布局及其支持文档与原RDA有很大不同。
  • 在原RDA中,LC-PCC政策声明(LC-PCC PS)与RDA说明链接,但在与原RDA工具包不同的位置。因为LC-PCC PS不受原RDA架构的限制,它们可以作为单独的“独立”文档进行维护和更新。随着时间的推移,许多LC-PCC PS变得很长,并且充满了许多示例。
  • 在官方RDA中,LC-PCC PS在官方RDA工具包中与相关选项或元素小节“内联”出现。LC-PCC PS仍然作为单独的“独立”文档进行维护和更新,但它们在官方RDA工具包中出现的“内联”方面极大地限制了它们可以包含的信息量。官方RDA工具包中的LC-PCC PS仅给出选项的应用决策,或有关元素子部分的更多信息。
  • 当原RDA工具包的LC-PCC PS被评估并映射到官方RDA工具包时,声明的较长部分以及示例被标记为一组单独的官方RDA工具包文档,元数据指导文档( MGD)。
  • 来自杨百翰大学、大英图书馆、加州大学伯克利分校、佛罗里达大学、俄勒冈大学、华盛顿大学的PCC成员,以及美国国会图书馆员工的团队,在2021年 6-10月之间创建了官方RDA工具包MGD 。

【MGD类型】

MGD有两种类型:叙述性MGD和一对一MGD。前者是概括性的,特别对于新RDA的新词汇、术语和语法,帮助用户熟悉与理解新RDA中元数据描述说明的整体架构和范式转变。

  • 叙述性MGD:共24个[似乎只有20个],映射到1400多个新RDA的PS。设“编目员判断区域”,将随RDA实施收到新数据而更新。涉及:
    • 关于描述特定RDA实体的说明,引用适用于实体的官方RDA工具包元素,同时允许当前的原RDA工具包政策和实践继续。如 MG: Works(作品) MG: Places(地点)
    • 需要理解新RDA中新实体和概念的说明,以使当前政策和实践得以继续。如 MG: Aggregates(合集) MG: Timespan(时间段)
    • PCC作品中使用的政策、概念和实践的说明,但在新RDA中没有涉及。如 MG: Access Point Syntax(检索点语法) MG: Basic Cataloging Decisions(基本编目决策) MG: Series-Subseries(丛编-子丛编)
  • 一对一MGD,共210个[加关系标签54有230+个],映射到500多个新RDA的PS。通常与官方RDA工具包中的特定选项或元素小节相关联,有指引(Guidance)说明及MARC和BIBFRAME (RDF)示例。如 MG: Work: Analysis of work(作品:作品分析) MG: Manifestation: Date of publication: Date of publication not identified(载体表现:出版日期:出版日期不确定) MG: Family: Language of family(家族:家族语言) MG: Place: Access point for place: Choice of larger place(地点:地点检索点:选择较大地点)

【MGD结构】

  • 叙述性MGD组成:概述、对原RDA的更改、元数据实施示例(RDA元素、指南、MARC示例、BIBFRAME示例)和编目员判断区域。可分为5类:
    • RDA实体(8个:作品、内容表达、载体表现、行为者、个人、团体、家族、地点、时间段。RDA共13个实体,载体表现、单件,以及新的RDA Entity、Collective Agent和Nomen没有相应的叙述性MGD)
    • RDA指南(3个:合集、虚构和真实非人类实体、转录-标点)
    • RDA关系[描述关系](3个:行为者-行为者、行为者-WEMI、WEMI-WEMI)
    • RDA资源(1个:词表编码方案VES)“元数据实施示例”细分4个论题:使用RDA VES、使用其他VES、不使用VES、混合方法。
    • 特殊编目论题(5个:检索点语法、基本编目决定、重印-复制、连续性作品和集成作品决定、丛编-子丛编)
  • 一对一MGD组成:指向RDA元素或子元素的链接、指引、MARC示例、BIBFRAME示例、参照和附注、更新历史。

附:MGD文件清单(Resource Description & Access (RDA) Metadata Guidance Documentation

  • 导论
  • 叙述性MGD(20个)
  • MGD索引
  • RDA实体MGD [含实体、关系、丛编]
    • (实体9种)
      • 作品:叙述性1,一对一17(其中一个属上位资源MG: Resources)
      • 内容表达:叙述性1,一对一5
      • 载体表现:一对一33
      • 单件:一对一1
      • 团体:叙述性1,一对一13
      • 家族:叙述性1,一对一17(其中一个是作品)
      • 个人:叙述性1,一对一6
      • 地点:叙述性1,一对一31
      • 时间段:叙述性1
    • (关系3种)
      • 关系标签(54):导论,作品关系标签8,内容表达关系标签8,载体表现关系标签3,单件关系标签3,个人关系标签8,团体关系标签8,家族关系标签8,地点关系标签8
      • 描述关系:叙述性3(A-A,A-WEMI,WEMI-WEMI)
      • 主题关系:一对一30(均为作品关系)
    • (丛编1种)
      • 丛编-子丛编:叙述性1,一对一28(作品元素18,载体表现元素9,非RDA元素1)

详见:2022年1月的《LC的RDA计划概要与进展》(LC RDA Project Summary and Update

参见:LC RDA计划概要与进展(新RDA实施推迟)(2022-3-20)

Wikidata的图书-版本两层结构(属性清单)

参见:Wikidata的数据类型及属性(2022-9-7)

Wikidata(维基数据)是Wikimedia旗下的免费知识库,拥有近1亿数据项(2022-9-7当下为 99,164,932 项)。作为一个关联数据源,Wikidata得到海外图书馆的利用,图书馆界也为Wikidata贡献数据。

2022年夏秋,LD4维基数据亲和组(LD4 Wikidata Affinity Group)正举办名为Wikidata Working Hours的系列活动。活动共10次,针对Wikidata中的儿童图书条目。使用威斯康星大学麦迪逊分校合作儿童图书中心的数据,让参与者尝试不同的 Wikidata 相关技能和工具。涵盖的主题包括:使用 OpenRefine 清理数据,使用 OpenRefine 协调数据,为个人作者、团体实体和作品/版本创建项(item),使用 OpenRefine 和 QuickStatements 批量上传项,以及编写 SPARQL 查询。

9月2日的第5次活动(Wikidata:WikiProject LD4 Wikidata Affinity Group/Wikidata Working Hours/Wikidata Working Hour Summer-Fall Project 2022/2022-September-2 Wikidata Working Hour)是用现有的儿童图书元数据电子表格,在 Wikidata 中创建作品和版本的数据项。

项(或数据项)相当于条目,其主要内容是一系列声明/语句(Statements),由属性+取值组成。活动页面分别列出了作品、版本及涉及的丛编对应的 Wikidata 属性(标识符为以P起首的数字),清单如下(应该只是常用而非完整属性):

作品基本语句(这些属性用于在 FRBR作品级别 表示一本书的项。作品应该是书面作品(Q47461344)的实例。作品的标签应该是题名,题名中大写的字母在 Wikidata 标签中是大写的。作品描述通常包括作品的形式和作者。)【中文名称取自Wikidata属性页中的简体中文[方括号中为自译];以下数据类型Item省略不注】

  • instance of 隶属于[…的实例](P31)取值:written work 
  • title 标题[题名](P1476,数据类型Monolingual text
  • author 作者(P50)当Wikidata项未知或不存在时使用author name string 作者姓名字符串(P2093,数据类型String
  • editor 编辑者(P98)
  • language of work or name 作品或名称的语言(P407)
  • has edition or translation 版本[有版本或译本](P747)
  • form of creative work 作品形式(P7937)
  • part of the series 所属系列[丛编](P179)

作品可选语句

  • genre 类型[体裁](P136)
  • main subject 作品主题(P921)
  • follows 之前是[先前](P155)followed by 之后是[后继](P156)
  • 【以下数据类型External identifier:分类法、作品ID】
  • Dewey Decimal Classification (P1036)Library of Congress Classification(P1149)Chinese Library Classification(P1189)Universal Decimal Classification(P1190)
  • OCLC work ID(P5331)Open Library ID(P648)LibraryThing work ID(P1085)Goodreads work ID(P8383)Babelio work ID(P3631)

版本基本语句(这些属性用于在 FRBR 内容表达/载体表现级别 表示一本书版本的项。 一本书的每个版本都应该有一个单独的维基数据项;如果内容(前言、后记、插图)、页码(页码)、出版商或出版地点发生变化,则应为该版本创建一个新项目;如果一本书是以前版本的相同再版(上述属性没有变化),则不需要新项目[特别注意:出版时间不在其列]。版本标签应该是书名。书名中大写的字母在 Wikidata 标签中是大写的。版本说明通常包括版本和作者的形式,以及与作品的区别,如出版日期、版本或插图画家。版本应该是version, edition, or translation (Q3331189)的实例。)【以下数据类型Item省略不注】

  • instance of(P31)取值:version, edition, or translation
  • edition or translation of(P629)
  • language of work or name(P407)
  • author(P50)P2093同作品
  • editor(P98)
  • illustrator(P110)
  • title(P1476,数据类型Monolingual text)subtitle(P1680,数据类型Monolingual text
  • edition number(P393,数据类型String
  • publisher(P123)publication date(P577,数据类型Point in time[即Time]
  • ISBN-10(P957,数据类型External identifier)ISBN-13(P212,数据类型External identifier

版本可选语句

  • translator(P655)
  • number of page(P1104,数据类型Quantity)
  • 【以下数据类型External identifier:图书ID】
  • SUDOC editions(P1025)K10plus PPN ID(P6721)EUL editions(P1084)BN (Argentine) editions(P1143)DNB editions(P1292)OCLC control number(P243)Open Library ID(P648)Google Books ID(P675)Internet Archive ID(P724)Project Gutenberg ebook ID(P2034)Bibliothèque nationale de France ID(P268)English Short Title Catalogue ID(P3939)Czech National Bibliography ID(P3184)Library of Congress Control Number (LCCN) (bibliographic)(P1144)RSL scanned books identifier
  • (P1815,数据类型String [未列入External identifier属性])

Series 所属系列[丛编]

  • instance of(P31)written work
  • title(P1476,数据类型Monolingual text)
  • author(P50)
  • publisher(P123)
  • has part(s)(P527)
  • genre(P136)

图书条目(作品或版本)即项(Item),其标识符为以Q起首的数字,其中的声明(Statements)默认三元组为:项(主体)+属性+取值(客体)。但如上所列属性,其中有数据类型非item的,比如文本title、时间publication date、外部标识符ISBN-13等,如何确定这些三元组的主体?有待了解。

参见实例:Snow Angel, Sand Angel / picture book by Ashley Lukashevsky,作品 Q113622633(https://www.wikidata.org/wiki/Q113622633),版本 Q113622573(https://www.wikidata.org/wiki/Q113622573

总结:Wikidata 采用作品-版本双层结构,其中作品对图书指 written work 书面作品(Q47461344),在条目的properties for this type部分列有如下属性:language of work or name,VIAF ID,genre。版本包括FRBR/LRM的内容表达和载体表现2个级别,指 version, edition, or translation 版本或译本(Q3331189),以expression、manifestation、adaptation等为其同义词,在本条目的properties for this type部分列有很多专用属性(可与上列属性清单对应)。