RDA元数据指导文档(MGD):合集

《IFLA图书馆参考模型》(LRM)引入“合集”模型(5.7 Modelling of Aggregates ),“合集定义为具体化多个内容表达的载体表现”。合集分3类:汇编(Collection Aggregate)、增加/增强(Augmentation Aggregate)、并列(Parallel Aggregate)。大致可以认为,合集对应于合订汇编,归于载体表现。

《资源描述与检索》(RDA)遵循LRM,在新RDA的指南部分有“Aggregates”(合集),对合集载体表现集合内容表达集合作品如何描述合集作出规定。

参见:(不同术语:集合作品/被集合作品|内容表达 vs 汇总/被汇总作品|内容表达)

RDA元数据指导文档(MGD)《合集》提供LC-PCC的相关指导,针对为具体化在合集中的内容表达提供检索和描述,即针对揭示载体表现中的内容表达,涉及检索点和相关附注。MARC示例提供字段内容及解说,BIBFRAME示例只提供属性及一般说明。

参见:RDA元数据指导文档(MGD):掌握新RDA(2022-9-10)

Official RDA Toolkit LC-PCC Metadata Guidance Document: Aggregates [PDF, 410 KB; 34页]
文档很长,几点笔记,示例仅提及MARC:

  • 合集是具体化多个内容表达的载体表现。所有合集都具体化两种类型的内容表达
    • 1、被集合内容表达,代表合集的内容。一个合集包含多个此类内容表达。
    • 2、集合内容表达。它是集合作品的内容表达。这是合集的计划,包括选择了哪些内容以及如何在合集中对其进行排序。计划不是内容本身,一个合集只包含一个此类内容表达。
  • 原始RDA允许在合集模型和整体/部分模型中选择。LC-PCC选择了整体/部分模型,对于作品的汇编,汇编中的个别作品与整体作品具有整体/部分关系。由于LRM采用合集模型,新RDA也遵循。“虽然这是一种新的思维方式,但除了使用新关系,结果应该看起来或多或少与使用原RDA生成的数据相同。”
  • 图书馆收藏的大多数资源都是合集。会议录、文集之类自不必说,含序言、插图、书目、索引的专著也被视为合集。
  • 序言、插图、书目、索引等专著常见成份视为增强内容,因此增强合集范围极广。增强内容有两种表达方式,即直接识别(提供分析检索点)或做附注(内容/目次附注、书目索引附注等)。对应的RDA元素可能有所变化,但MARC记录与原有做法没什么差别,只是需要用新的概念去理解。
  • 对合集中不同内容有不同处理方法,“没有必要或不希望提供对合集中所有内容表达的检索或描述”(比如序言就常被忽略)。
  • 合集外延很大,有的载体表现具有不止一种合集的特征(比如有序言的双语对照诗集)。要求“按以下顺序应用本文档中的指南:汇编合集、并列合集、增强合集”。
  • 汇编合集所用MARC字段示例:
    • 1、检索集合内容表达:100+240;
    • 2、检索内容(被集合内容表达):第1个或主要被集合内容,分析 700$i Expression manifested: 或505基本内容附注(其他由编目员判断);
    • 3、与其他描述关系(链接款目,各被集合内容表达有对应独立载体表现/单独记录[如合订本]):774 08 $iPart manifestation: $w
  • 并列合集所用MARC字段示例:
    • 1、不要创建受控检索点来表示并列合集的集合内容表达【不做130/240统一题名】;
    • 2、提供原始语言内容表达、首个翻译的直接检索,其他编目员判断。内容检索:分析 700/730$i Expression manifested:
  • 增强合集所用MARC字段示例:
    • 1、检索主要内容:100+245或130;
    • 2、检索增强内容:分析 730$i Expression manifested: 或505增强内容附注;
    • 3、描述增强内容:通用附注500或专用附注504、300$b插图等。
  • 正式内容附注:在505字段目次中提供的信息,如通常只记录正题名和首个第一责任说明,如果个别卷没有题名则记为 [without special title],以及编号、标点等各种细节,用到时可细查。
    • 另有LC针对e-CIP是否做内容附注的效率与收益考量。
  • 分析编目(通常不做):为被集合内容表达(即部分内容)做记录,关联被集合内容表达的描述到合集载体表现:773 08 $i Part of manifestation: $w;关联到集合内容表达:700 1# $i Aggregated by:
  • 丛编-子丛编:LC早些年已放弃维护丛编规范。
    • 通常不做丛编记录,如果做:
      • 1、子丛编(作品)关联到其主丛编(作品):760$i Subseries of: ;
      • 2、主丛编(作品)关联到其子丛编(作品):762$i Subseries: ;
      • 3、不做卷期载体表现记录、但希望提供期的检索:丛编记录中分析 730$i Issue:。
    • 通常载体表现中做丛编某卷期:490/830(二者不一致时)[不用700/730$i Issue of:]

RDA元数据指导文档(MGD):虚构和真实非人类实体

《IFLA图书馆参考模型》(LRM)规定,虚构的或非真实的实体不属于通常所属的类型。包括:

  • 虚构人物和非真实人类实体不属于“个人”(Person),见LRM-E7的范围注释:“个人实体仅限于有生命或认为有过生命的真实个人”。“一般认为是虚构的(如科米蛙)、文学性的(如简·马普尔小姐)或纯粹传说性质的(如巫师梅林)人物不是实体个人的实例”。
  • 非真实的地点不属于“地点”(Place),见LRM-E10的范围注释:“想象的、传说中的或虚构的地点不是地点实体的实例”。

这些实体被归入最宽泛的类型“资源”(Resource),非人类实体(如动物)也如此。见LRM-E1的范围注释:“资源是明确定义的所有其他实体的超类,以及没有明确标记的任何其他实体的超类”。样例:

  • {Miss Jane Marple} [阿加莎·克里斯蒂(Agatha Christie)多部小说和故事中的人物]
  • {Earthsea} [一个虚拟的世界,厄修拉·K·勒古恩(Ursula K. Le Guin)创作的《地海三部曲》(Earthsea trilogy)的背景]
  • {Pal} [1940年6月4日-1958年6月在世,一只雄性粗毛牧羊犬,1943年至1954年在电影中出演灵犬莱西(有几只帕尔的后代在后来的影视作品中也扮演了灵犬莱西)]

《资源描述与检索》(RDA)遵循LRM,作品的责任只能归于真实的人类或集体行为者。在新RDA的指南部分有“Fictitious and non-human appellations”(虚构和非人类称谓),在载体表现中作为责任说明出现时:对虚构实体,其称谓被假定是行为者、集体行为者、团体、家族或个人的化名称谓[假名、笔名等];对非人类实体,则视为RDA外部的实体。指南介绍了不同条件与选项下使用的RDA元素,但如果落实到MARC记录中会怎么样?

参见:RDA元数据指导文档(MGD):掌握新RDA(2022-9-10)

Official RDA Toolkit LC-PCC Metadata Guidance Document: Fictitious and Real Non-Human Entities [PDF, 233KB, 5页]
RDA元数据指导文档(MGD)的《虚构和真实非人类实体》,提供了LC-PCC的新RDA做法(2022年9月尚未实施),包括MARC和BIBFRAME示例。

  • 简单地说,MARC做法基本照旧

规范记录照旧:“将继续在NAF [名称规范档] 中建立虚构人物和真实的非人类实体的名称规范记录(NAR)”。特别强调提供“实体类型名称”,放在原就有且常用的100$c(头衔和其他相关词):“PCC正在开发用于这些非RDA行为者的实体类型词表”。

书目记录照旧:“根据需要,虚构人物和真实的非人类实体可以在书目记录中创作作品”。

看上去主要变化是:规范和书目记录的040$e(编目来源之描述规则)采用新代码pccrda,而不是rda。“表明这些记录符合PCC对RDA的实施”(换言之,这些是非RDA记录)。本MGD在概述中说,书目记录的描述规则代码未定,但示例中采用了相同新代码。

  • 至于BIBFRAME,似乎完全不涉及这个问题:“将Nomen实例的IRI记录为真实世界对象[RWO]”。换言之,不区分虚构、真实非人类实体,和人类一样,都是RWO。

MARC转换到BIBFRAME的愚人节公告

四月的上海,可以说整月都是愚人节【COVID-19】。所以,现在发这个愚人节故事似乎也不算太晚。

4月1日那天,Jeffrey Edmunds在BIBFRAME邮件组发帖“MARC转换到BIBFRAME”。文中可见对此一趋势的不满,对小型图书馆被抛弃的无奈。也提到相关的重要机构LC和OCLC,在MARC及其转向关联数据过程中有重要影响的人物Terry Reese、Roy Tennant和Lorcan Dempsey,重要的编目软件Connexion、MarcEdit和Sinopia。

MARC –> BIBFRAME transition(全文翻译如下)

即时发布

美国国会图书馆今天宣布,自2022年7月1日起,所有LC系统将从MARC转换为BIBFRAME。

  • MARC记录将不再由LC创建或从LC获得
  • 现有的书目记录将以RDF三元组被原子化、存储及提供
  • 所有LC发现工具的搜索结果都将呈现为知识图谱而不是列表

在LC宣布的同时,OCLC公布了将WorldCat从基于MARC的数据库转变为基于BIBFRAME的三元组存储的计划。OCLC的编目客户端Connexion将于2022年7月1日停用,并由Sinopia取代,以允许OCLC成员以BIBFRAME本地创建和管理书目元数据。

BIBFRAME和关联数据倡导者称赞该公告是十多年发展的顶峰。高级图书馆管理者April Fisch说:“通过这一公告,我们看到了数千小时工作和数百万美元投资的成果。现在,当用户搜索我们系统之一时,他们将看到的不是一个无聊的可用资源列表,而是一些漂亮的东西,比如知识卡和指向其他事物的链接,以及更多指向其他事物的其他事物的链接,以及更多指向其他链接的链接带有更多链接的信息和链接。旨在将用户与资源联系起来的传统图书馆发现系统已经过时。这些新系统将把用户与一切联系起来,我相信我们会同意,这更酷。”

Roy Tennant,二十年前他的心声:“MARC必须死!”终于被听到了,大喜过望。 “终于!”据报道,他明显松了一口气。 “我开始以为MARC可能永远不会死!” (另一方面,MarcEdit的创建者和ALCTS编目和元数据管理部门颁发的2019年Margaret Mann奖获得者Terry Reese沮丧地在俄亥俄州立大学校园内蹒跚而行,喃喃自语“现在怎么办?” )

Lorcan Dempsey著名地观察到“发现发生在别处”。由于BIBFRAME完全放弃了MARC,发现现在将无处不在,即使用户无法判断它正在发生。

BIBFRAME 和关联数据长期承诺的极大改善的用户体验现在将成为现实。新系统不再回答诸如“我在哪里可以买到这本书?”之类的无聊问题,而是允许用户形成诸如“向我展示生活在18世纪并在莱比锡出版的名叫玛丽亚的德国女作家的所有资料”之类的查询。或者柏林、还有谁有红头发、或棕色、还有一只名叫基普的腊肠犬。”

当被问及资源较少且现场技术专业知识较少的小型图书馆如何应对巨变时,LC政策和标准部的一位发言人发表了以下声明:

“嗯,不确定。”