如何为用AI软件生成的资源做编目

随着新一轮人工智能(AI)软件的兴起,开始出现用AI软件生成的图书(纸书或电子书)。2024年初,合作编目项目(PCC)标准委员会编写了一个指导性文件《PCC常见问题解答:为用AI软件生成的资源做编目》,包括4个问题解答及8个实际资源的示例,及时又实用。

以下为此FAQ的翻译及简单备注(示例仅列1)。概而言之:人类行为者仍视情况使用100/700字段,所用AI软件作为相关作品(使用130/730字段),可添加653主题/655体裁术语表明为AI软件生成,必要时用附注说明。

PCC FAQ: Cataloging of Resources Generated Using Artificial Intelligence (AI) Software / PCC Standing Committee on Standards. 2024-2-8. https://www.loc.gov/aba/pcc/scs/documents/FAQ-Cataloging-of-Resources-Generated-by-Artificial-Intelligence

1、AI软件程序是否可以被视为作者、艺术家、作曲家、插画家、翻译人员或其他与资源相关的行为者?【AI软件不是行为者,是作品、用130/730字段】

根据《主题标题手册》备忘录H 405(以名称或主题规范档建立某些实体),计算机程序和软件是在名称规范档中建立的“第一组”实体,通常使用MARC字段130(题名)。

将用于创建资源的命名AI或生成式计算机程序视为相关作品,而不是作为行为者,即使编目的资源将AI或其他计算机程序作为创建者或贡献者。

2、如何对待编程或操作用于生成资源的AI软件的行为者?【人类行为者、用100/700字段;做附注】

当已知时,记录负责操作、提示、编辑在编资源中的命名AI或生成式计算机程序的输出的个人或集体行为者,作为相关行为者。与AI生成的资源相关联的人类行为者通常可以呈现为作者、编者、编译者或提示者,也可以是未命名的。

负责开发、编程或托管AI软件的行为者也可以被视为与正在编目的资源相关的行为者。这些行为者也可以作为相关行为者记录在软件的规范记录中(见示例8[规范记录])。

如果与资源相关联的行为者的具体角色不明确,使用通用元素名称,如“创建者”或“贡献者”,或者不要分配关系说明语。参阅《在书目记录中应用关系说明语培训手册》的指导方针4和5。

如有必要,在附注中说明归因。

3、AI的名称可以被认为是人类行为者的笔名吗?【作为个人笔名;做附注】

一般来说,将软件名称本身视为相关作品,而不是软件操作员或程序员的笔名。如果软件有多个名称,这些名称可以被视为软件的变异题名。

如果使用AI软件创建的资源以笔名显示,则将其视为人类行为者的笔名,而不是软件的笔名。如果由人类行为者在不使用AI软件的情况下创建的资源仍然虚拟地呈现为由AI软件创建的资源,那么任何虚构的AI名称也可能被视为人类行为者的笔名。参阅《LC/PCC为使用笔名的个人创建名称规范记录(NAR)的做法》。

如有必要,在附注中说明归因。

4、还能如何传达AI软件在创建或贡献资源中的作用?【653主题/655体裁术语】

考虑通过相关主题和/或体裁术语来传达AI软件在创建资源中的作用。参见示例1、5和6。

Example 1:

  • 245 00 $a I am code : $b an artificial intelligence speaks / $c poems by code-davinci-002;editedby Brent Katz, Josh Morgenthau, and Simon Rich.
  • 500 __ $a The Code-davinci-002 program, developed by OpenAI, was used to generate the poetry.【由OpenAI开发的Code-davinci-002程序用于生成诗歌】
  • 655 _7 $a Computer poetry. $2 lcgft【索引词-体裁】
  • 700 1_ $a Katz, Brent, $e editor.
  • 700 1_ $a Morgenthau, Josh, $e editor.
  • 700 1_ $a Rich, Simon, $e editor.
  • 730 0_ $i Related work: $a Code-davinci-002.

【Example 2-8 略】

RDA元数据指导文档(MGD):时间段

RDA元数据指导文档(MGD)是美国为实施新RDA,与《美国国会图书馆-合作编目项目政策声明》(LC-PCC PS)配套使用的文档,提供新RDA的详细说明与示例,有助于以新RDA完成编目工作。

MGD包含包括20多个叙述性MGD,200多个一对一MGD,时间段(Timespan)是叙述性MGD之一。

之前写过的MGD相关博文:

Timespan (Official RDA Toolkit — LC-PCC Metadata Guidance Document, 2022-01-31)

【总结】

  • 时间段(Timespan)是《IFLA图书馆参考模型》(LRM)引入的新概念,是新的RDA实体。
  • 在原RDA中,时间(日期,Date)是“属性”。由于新RDA的时间段是实体,与时间有关的元素就成为各实体与时间段实体之间的“关系”。
  • 时间段有2种记录方式:结构化描述,应用扩展日期时间格式(EDTF)或ISO 8601(如:1971-12-19);非结构化描述,转录载体表现显示的日期。(对于元素“时间段标识符”(identifier for timespan),应该归入第3种记录方式“标识符”?)
  • 有关日期/时间段,原RDA和新RDA虽然在概念上有变化,但记录方法没有变化,即编目时做书目/规范记录没有变化。
  • 相关的LC-PCC PS有意保持开放,即不做实质性规定,而是指示编目员应用选项或行使编目员判断。应用“记录由应用纲要指定的元素”选项,意味着编目机构可以建立自己的记录时间段的政策和实践。

元数据指导文档(MGD):时间段

MGD汇总了所有13个RDA实体(包括时间段本身)的时间段相关元素(合计57个):

  • (时间段的)属性 Attribute(3个):类别 category of timespan;附注 note on timespan;相关实体related entity of timespan
  • 命名 Nomen(10个):称谓 appellation of timespan(下位元素3个:access point for timespan,name of timespan,identifier for timespan);检索点 access point for timespan,规范检索点 authorized access point for timespan,变异检索点 variant access point for timespan(用于结构化描述;尚未实施);名称 name of timespan,首选名称 preferred name of timespan,变异名称 variant name of timespan(用于非结构化描述);标识符 identifier for timespan。使用日期 date of usage of(见:Nomen > date of usage);相关 related nomen of timespan(不著录)
  • 时间段 Timespan(7个):开始 beginning / beginning of,结束 ending / ending of;部分 part of timespan / part timespan;相关 related timespan of timespan
  • 作品 Work(7个) :date of work of;纪元 epoch of,春分/秋分 equinox of;主题 subject timespan of;timespan described in;学位年 year degree granted of;相关 related work of timespan
  • 内容表达 Expression(5个):date of expression of,代表性内容表达 date of representative expression of;抓取 date of capture of,date of capture of representative expression of;相关 related expression of timespan
  • 载体表现 Manifestation(7个):date of manifestation of;出版、生产、制作、发行、版权 date of publication of,date of production of,date of manufacture of,date of distribution of(见:Manifestation > date of distribution),copyright date of;相关 related manifestation of timespan
  • 单件 Item(1个):相关 related item of timespan
  • 行为者/集体行为者 Agent(4个): 活动时期 period of activity of agent of,period of activity of collective agent of;相关 related agent of timespan,related collective agent of timespan
  • 个人 Person(4个):生卒日期 date of birth of,date of death of;活动时期 period of activity of person of;相关 related person of timespan
  • 家族 Family(2个):活动时期 period of activity of family of;相关 related family of timespan
  • 团体 Corporate Body(5个)建立、终结 date of establishment of,date of termination of;活动时期period of activity of corporate body of;会议 date of conference of;相关 related corporate body of timespan
  • 地点 Place(1个):相关 related place of timespan
  • RDA Entity(1个):相关 related RDA Entity of timespan

PCC RDA入门培训:第1阶段(2024)

“RDA入门”……再次从头开始,由原RDA到新RDA(官方RDA),如同当年从AACR2改用RDA。

2023年中,美国合作编目项目(PCC)决定自2024.5.1-2027.4.30滚动实施新RDA(参见:美国2024年5月起实施新RDA(2023-7-17)),在2023年12月准备好了一套17个模块的入门培训资料,包括PPT及练习题、答案,免费上网:

Phase 1: PCC Introductory RDA Training

  • “培训材料由培训常设委员会(SCT)RDA培训工作组(专著)的前任和现任成员编写。
  • 第一阶段的培训包括17讲(模块),供PCC编目员、决策者和专家识别3R项目期间引入的关键变化,使用和导航RDA工具包,理解新概念,并定义关键的词表术语。第一阶段培训为学习者准备第二阶段培训,第二阶段的培训将侧重于RDA的实践。
  • 培训模块专为面对面或虚拟教学而设计,可用于本地、地区或全国编目人员的自学或培训。如果对PCC SCT RDA培训任务组(专著)给予致谢,培训材料也可以进行改编。”

昨天由CALIS联合目录得知,用这套资料的在线培训正在进行中(2024.3.13-5.22),每周一次共11次,首次培训的Zoom会议视频已上网(时长1.5小时):

Phase 1: PCC Introductory RDA Training Webinars

  • 第一讲中,说明培训的重要性:除了新的RDA工具包外,官方RDA还引入了许多新的术语和概念,能够使用RDA工具包并理解新的术语和概念对于实施至关重要。
  • 培训将达成4个成果:[1]确定3R项目期间引入的关键变更;[2]使用和导航RDA工具包;[3]定义关键词表术语;[4]了解新概念。
  • 接下来的第2阶段培训,面向RDA实践。完成第2阶段培训后,能够:使用官方RDA工具包、LC-PCC应用纲要、LC-PCC政策声明和《元数据指导文档》(MGD)编目印刷和电子专著,查找并解释RDA说明以回答编目问题。

Phase 1: PCC Introductory RDA Training 培训模块

1 Overview of Phase 1: Introductory RDA Training

  • Introduction to RDA 入门

2 Development and Basics of RDA

3 Objectives and Principles Governing RDA

  • Using the RDA Toolkit 工具包

4 Getting Started with RDA Toolkit

5 Navigating RDA Toolkit

6 Searching RDA Toolkit

7 Personalizing RDA Toolkit

  • RDA Terminology and Concepts 术语与概念

8 Recording Methods

9 Data Provenance

10 Coherent and Minimum Descriptions

11 RDA Entities and Elements

12 Timespan

13 Nomens and Appellations

14 Manifestation Statements

15 Representative Expression

16 Aggregates

17 Diachronic Works

部分术语与概念,可参见先前博文: