PCC人工智能和机器学习战略规划任务组,如其名称所示,这个小组的任务是为合作编目项目(PCC)制定人工智能(AI)和机器(ML)学习的“战略规划”。最终报告2024-5-9通过,政策委员会将根据建议修改PCC的2023-2027年战略方向,另将成立一个新的工作组来执行建议的行动。
参见:PCC 2023-2027战略方向(2023-3-24)(只翻译了6个SD(战略方向)、省略了其下具体行动(Actions),本报告更新的是若干“行动”)
PCC Task Group on AI and Machine Learning for Cataloging and Metadata: Final Report. 2024-4-15. [30页]. https://www.loc.gov/aba/pcc/taskgroup/TG-Strategic-Planning-AI-final-report.pdf
小组的主要工作是2024年3月在相关邮件组进行的一项问卷调查(环境扫描),调查结果分析构成了最终报告的主部分。
执行摘要转录报告正文相关内容,包括了小组主要成果。翻译如下:
— Executive Summary 执行摘要 —
2023年12月,PCC编目和元数据人工智能和机器学习任务组被任命对PCC社区进行环境扫描【附录B 职责】,以收集AI对编目和元数据操作的当前活动和影响的快照。该调查于2024年3月进行【附录D 问卷】,共收到193份回复。根据这些回应,工作组为PCC制定了一套建议和潜在的行动项目,以支持、教育和协调围绕AI和编目的工作。
此外,工作组还收集了一套关于AI和编目的初步资源【附录C】,将通过PCC Wiki共享。我们设想这个维基空间是使用AI和ML的编目从业者之间进行交流和协作的地方。
在我们的工作过程中,工作组确定了一些总体主题,随着PCC在这一领域的工作取得进展,这些主题将被考虑在内。这些主题为工作组提出的建议和行动项目的发展提供了信息。
Themes 主题【Discussion 讨论】
- 需要与图书馆管理者和更广泛的编目社区明确沟通,AI不是一个容易搞定或省钱的方法。AI和ML技术需要时间和仔细考虑才能有效实施,必须与编目和元数据专家协同完成。
- 人们普遍担心缺乏资源来调查和实施AI。许多机构都参与了系统迁移、官方RDA和/或关联数据的培训,或者通常资源不足或规模太小,无法实际花时间使用AI。
- 一些受访者报告称,利用AI和ML来协助编目和元数据工作的不同方面取得了成功(不同程度)。其他人则报告了失败或不令人印象深刻的结果,以及对AI发展成为有用编目工具的能力普遍不信任。
- 多名受访者表示不信任寻求从AI中获利的商业实体,担心AI将在没有适当审查的情况下强加给我们,或者AI将被用于彻头彻尾的邪恶目的。
- 其他受访者认为,AI和ML是已经影响我们世界的工具,学习如何最大限度地利用这些工具最符合编目和元数据从业者的利益。
- 虽然我们无法预测AI将对编目产生什么影响,以及我们在未来1年、5年或10年如何开展工作,但我们需要在编目指南和平台(如RDA和BIBFRAME)的并行开发背景下考虑这些发展,并与适当的利益相关者合作。
Recommendations 建议【Timeline 时间线】
工作组建议成立一个新的工作组,以执行本报告中确定的交付成果。该工作组应具有广泛的代表性,初始任命期为1年。可交付成果反映在下文建议的战略方向行动项目中。
- 撰写并分发一份关于在编目和元数据工作中使用AI和ML技术的原则声明。目标是传达仔细考虑和规划的必要性,并传达AI不会省钱或消除编目工作。(时间框架:3个月)[SD2.1]
- 为有兴趣分享知识和尝试AI的编目员建立一个实践社区,该社区应向PCC和非PCC图书馆人员开放。(时间框架:6个月)[SD5.3]
- 联系那些一直在试验和实施AI相关编目项目的国际图书馆社区。(时间框架:正在进行中)[SD1.1]
- 进一步充实PCC维基上的AI资源,并根据需要进行更新。(时间框架:正在进行中)[SD5.3]
- 与NARDAC、ALA、国会图书馆、公平、多样性、包容性、归属和可访问性咨询委员会(EDIBA)以及其他主要利益相关者合作,共同开发编目标准和平台,以共同考虑AI对编目工作未来的影响。(时间框架:正在进行中)[SD1.1]
- 制定并分发一份最佳实践文件,将AI和ML纳入编目和元数据工作。(时间框架:1年)[SD2.1]
- 与培训常务委员会(SCT)合作,开发培训资源,以更多地了解或尝试AI。(时间框架:1年)[SD5.3]
Action Items for PCC Strategic Directions PCC战略方向的行动项目【Action Items】
根据PCC战略方向2023-2027,建议采取以下行动项目。行动项目草案以斜体表示。
SD1:与更广泛的元数据利益相关者社区接触
- 1.1. 扩大与图书馆软件和元数据提供商的合作,包括供应商和开源社区,同时铭记可访问性和通用设计原则
- 1.1.7. 成立一个任务组,启动参与人工智能(AI)和机器学习(ML)编目和元数据应用开发和实施的利益相关者之间的沟通与合作
SD2:促进技术多元化和持续相关性的文化
- 2.1. 支持创建和可持续发展各种编码格式/结构/序列化的高质量元数据,包括MARC、BIBFRAME和其他标准
- 2.1.6支持和促进使用人工智能(AI)和机器学习(ML)进行编目和元数据工作的最佳实践的发展
SD5:评估和改进PCC存储和共享知识的方式
- 5.3. 制定培训/指导计划,允许所有背景的元数据从业者(无论PCC成员身份如何)在需要时与PCC专业知识接触
- 5.3.3与培训常务委员会(SCT)合作,开发培训资源,以更多地了解或尝试人工智能