PCC人工智能和机器学习战略规划任务组最终报告

PCC人工智能和机器学习战略规划任务组,如其名称所示,这个小组的任务是为合作编目项目(PCC)制定人工智能(AI)和机器(ML)学习的“战略规划”。最终报告2024-5-9通过,政策委员会将根据建议修改PCC的2023-2027年战略方向,另将成立一个新的工作组来执行建议的行动

参见:PCC 2023-2027战略方向(2023-3-24)(只翻译了6个SD(战略方向)、省略了其下具体行动(Actions),本报告更新的是若干“行动”)

PCC Task Group on AI and Machine Learning for Cataloging and Metadata: Final Report. 2024-4-15. [30页]. https://www.loc.gov/aba/pcc/taskgroup/TG-Strategic-Planning-AI-final-report.pdf

小组的主要工作是2024年3月在相关邮件组进行的一项问卷调查(环境扫描),调查结果分析构成了最终报告的主部分。

执行摘要转录报告正文相关内容,包括了小组主要成果。翻译如下:

— Executive Summary 执行摘要

2023年12月,PCC编目和元数据人工智能和机器学习任务组被任命对PCC社区进行环境扫描【附录B 职责】,以收集AI对编目和元数据操作的当前活动和影响的快照。该调查于2024年3月进行【附录D 问卷】,共收到193份回复。根据这些回应,工作组为PCC制定了一套建议和潜在的行动项目,以支持、教育和协调围绕AI和编目的工作。

此外,工作组还收集了一套关于AI和编目的初步资源【附录C】,将通过PCC Wiki共享。我们设想这个维基空间是使用AI和ML的编目从业者之间进行交流和协作的地方。

在我们的工作过程中,工作组确定了一些总体主题,随着PCC在这一领域的工作取得进展,这些主题将被考虑在内。这些主题为工作组提出的建议和行动项目的发展提供了信息。

Themes 主题【Discussion 讨论】

  • 需要与图书馆管理者和更广泛的编目社区明确沟通,AI不是一个容易搞定或省钱的方法。AI和ML技术需要时间和仔细考虑才能有效实施,必须与编目和元数据专家协同完成。
  • 人们普遍担心缺乏资源来调查和实施AI。许多机构都参与了系统迁移、官方RDA和/或关联数据的培训,或者通常资源不足或规模太小,无法实际花时间使用AI。
  • 一些受访者报告称,利用AI和ML来协助编目和元数据工作的不同方面取得了成功(不同程度)。其他人则报告了失败或不令人印象深刻的结果,以及对AI发展成为有用编目工具的能力普遍不信任。
  • 多名受访者表示不信任寻求从AI中获利的商业实体,担心AI将在没有适当审查的情况下强加给我们,或者AI将被用于彻头彻尾的邪恶目的。
  • 其他受访者认为,AI和ML是已经影响我们世界的工具,学习如何最大限度地利用这些工具最符合编目和元数据从业者的利益。
  • 虽然我们无法预测AI将对编目产生什么影响,以及我们在未来1年、5年或10年如何开展工作,但我们需要在编目指南和平台(如RDA和BIBFRAME)的并行开发背景下考虑这些发展,并与适当的利益相关者合作。

Recommendations 建议【Timeline 时间线】

工作组建议成立一个新的工作组,以执行本报告中确定的交付成果。该工作组应具有广泛的代表性,初始任命期为1年。可交付成果反映在下文建议的战略方向行动项目中。

  • 撰写并分发一份关于在编目和元数据工作中使用AI和ML技术的原则声明。目标是传达仔细考虑和规划的必要性,并传达AI不会省钱或消除编目工作。(时间框架:3个月)[SD2.1]
  • 为有兴趣分享知识和尝试AI的编目员建立一个实践社区,该社区应向PCC和非PCC图书馆人员开放。(时间框架:6个月)[SD5.3]
  • 联系那些一直在试验和实施AI相关编目项目的国际图书馆社区。(时间框架:正在进行中)[SD1.1]
  • 进一步充实PCC维基上的AI资源,并根据需要进行更新。(时间框架:正在进行中)[SD5.3]
  • 与NARDAC、ALA、国会图书馆、公平、多样性、包容性、归属和可访问性咨询委员会(EDIBA)以及其他主要利益相关者合作,共同开发编目标准和平台,以共同考虑AI对编目工作未来的影响。(时间框架:正在进行中)[SD1.1]
  • 制定并分发一份最佳实践文件,将AI和ML纳入编目和元数据工作。(时间框架:1年)[SD2.1]
  • 与培训常务委员会(SCT)合作,开发培训资源,以更多地了解或尝试AI。(时间框架:1年)[SD5.3]

Action Items for PCC Strategic Directions PCC战略方向的行动项目【Action Items】

根据PCC战略方向2023-2027,建议采取以下行动项目。行动项目草案以斜体表示。

SD1:与更广泛的元数据利益相关者社区接触

  • 1.1. 扩大与图书馆软件和元数据提供商的合作,包括供应商和开源社区,同时铭记可访问性和通用设计原则
  • 1.1.7. 成立一个任务组,启动参与人工智能(AI)和机器学习(ML)编目和元数据应用开发和实施的利益相关者之间的沟通与合作

SD2:促进技术多元化和持续相关性的文化

  • 2.1. 支持创建和可持续发展各种编码格式/结构/序列化的高质量元数据,包括MARC、BIBFRAME和其他标准
  • 2.1.6支持和促进使用人工智能(AI)和机器学习(ML)进行编目和元数据工作的最佳实践的发展

SD5:评估和改进PCC存储和共享知识的方式

  • 5.3. 制定培训/指导计划,允许所有背景的元数据从业者(无论PCC成员身份如何)在需要时与PCC专业知识接触
  • 5.3.3与培训常务委员会(SCT)合作,开发培训资源,以更多地了解或尝试人工智能

文化遗产信息交换的CIDOC CRM兼容模型家族

【关于CIDOC CRM

CIDOC(International Council for Documentation 国际文献理事会/国际文献工作委员会)是ICOM(International Council of Museums 国际博物馆理事会/国际博物馆协会) 的一个委员会。CIDOC CRM https://www.cidoc-crm.org/ 是文化遗产领域著名的概念参考模型,也称为形式本体。它定义一套类 [E1……] 和属性 [P1……],用于描述文化遗产文献中使用的概念和关系。

CIDOC CRM自2006年成为ISO国际标准,2014年更新。最新版 ISO 21127:2023 信息与文献——文化遗产信息交换的参考本体Information and documentation — A reference ontology for the interchange of cultural heritage information,Edition 3),相当于其内部版本Version 7.1.3(https://www.cidoc-crm.org/versions-of-the-cidoc-crm)。网站有2010年v5.0.2的简体中文版,吴毅慧翻译、洪政欣教授修订编审、新加坡文物保管中心赞助。

CIDOC CRM兼容模型

多年前,国际图联(IFLA)把《书目记录的功能需求》(FRBR)与之对标,完成FRBRoo(2009年v1.0)。当功能需求家族(FRBR、FRAD、FRSAD)统一为《IFLA图书馆参考模型》(LRM)后,FRBRoo也顺理成章更新为LRMoo(2024年1.0版)。

另外,针对连续出版物,完成PRESSoo(2014年v1.0版,最新2017年v1.3)。

除图书馆界这两个兼容标准外,还有文化遗产相关的多样化且不断增长的兼容模型,目前共11个。其中与图书馆界合作的2个命名方式强调“面向对象”(oo=object-oriented),其他均沿用“概念参考模型”(CRM=Concept Reference Model)。网页中各自的“Resources”链接,提供从草案开始的各种版本:

Compatible models & Collaborations(https://www.cidoc-crm.org/collaborations

  • LRMoo Library Reference Model 图书馆参考模型【2024-8-8 页面链接 https://www.cidoc-crm.org/frbroo/ 未更新、已失效、跳转到主页,当为 https://www.cidoc-crm.org/lrmoo/
  • PRESSoo Model for publishing of periodicals 连续出版物出版模型
  • CRMinf Argumentation model 论证模型
  • CRMarchaeo Excavation Model 考古发掘模型
  • CRMsci Scientific observation model 科学观测模型
  • CRMgeo Spatiotemporal model 地理时空模型
  • CRMdig Model for provenance metadata 来源元数据模型
  • CRMba Model for Archaeological Buildings 考古建筑模型
  • CRMtex Model for the study of ancient texts 古代文本研究模型
  • CRMsoc Model for Social Phenomena 社会现象模型
  • CRMact Model for Activity Plan 活动计划模型

相关博文

2024年IFLA新项目“UNIMARC未来”及新标准LRMoo等

2024年6月《IFLA标准通讯》第2卷第1期发布(IFLA Standards Newsletter. Volume 2, Issue 1. https://repository.ifla.org/handle/123456789/3413)。参见:《IFLA标准通讯》创刊(2023-3-31)

以下为出自第2卷第1期的2024年国际图联(IFLA)标准动态。

一、新项目:UNIMARC未来

2024年初,UNIMARC常设委员会(PUC)启动“UNIMARC未来”项目。信息来源:UNIMARC for Entity-Relationship Cataloguing: Structuring Principles, Current Situation and Key Issues/ Florence Tfibel (Liaison, Permanent UNIMARC Committee)

项目网页:Future of UNIMARC. https://www.ifla.org/g/unimarc-rg/projects/

  • UNIMARC目前提供两种编目选项,也称编目轨道(cataloguing tracks)1)UNIMARC-ER(实体关系编目);2)“传统”UNIMARC编目。
  • UNIMARC的实体和关系:现在几乎涵盖IFLA LRM模型的所有方面

“UNIMARC未来”项目旨在促进交流、分享和产生关于UNIMARC未来的知识,重点是探索 UNIMARC 的使用范围,提高对其实体关系 (ER) 编目轨道的熟悉程度,并收集有关图书馆社区需求的信息。

目前正进行一项全球调查:Landscape of Data Structure and Exchange Standards Survey. https://1ka.arnes.si/unimarcsurvey2024【2024-7-17,8-4访问,页面锁定、内容为空】。

2024年11月12日将在斯洛文尼亚(及在线)召开第6届 UNIMARC 用户会议:6th UNIMARC Users Meeting: Charting the Course: Future-Forward Cataloguing with UNIMARC. https://www.ifla.org/permanent-unimarc-committee-puc/6th-unimarc-users-meeting/

二、新标准。已批准(但截止2024-8-4均未在IFLA网站查到最新的标准文本)

1、《LRMoo:<国际图联图书馆参考模型>的面向对象定义与映射》(LRMOO: object-oriented definition and mapping from the IFLA Library Reference Model)

LRMoo 1.0版于2024年4月获得国际图联专业委员会批准,取代2016年发布的FRBRoo 2.4版(如同LRM取代FRBR、FRAD、FRSAD),与博物馆界的概念参考模型最新版CIDOC CRM 7.1.3版本兼容,在两个社区发布,CIDOC-CRM网站有PDF/DOC版本:https://www.cidoc-crm.org/lrmoo/fm_releases

2、《国际图联ENSULIB绿色可持续图书馆指南》(IFLA ENSULIB Guidelines for Green and Sustainable Libraries)

IFLA网页显示(The IFLA Guidelines for Green and Sustainable Libraries)https://www.ifla.org/the-ifla-guidelines-for-green-and-sustainable-libraries/,目前正寻求建议与期望,要求2024年9月15日前发送案例。

3、《在线环境下的继续专业发展指南》(Guidelines for Continuing Professional Development in the Online Context)

现有文件《国际图联继续专业发展指导方针:原则和最佳实践》(IFLA Guidelines for Continuing Professional Development: Principles and Best Practices (2016))https://www.ifla.org/files/assets/cpdwl/guidelines/ifla-guidelines-for-continuing-professional-development.pdf的进一步发展。

4、《多元文化社区:图书馆服务指南》(第4版)(Multicultural Communities: Guidelines for Library Services (4th edition))

为移民的图书馆服务,更新2009年第3版(https://repository.ifla.org/bitstream/123456789/462/1/multicultural-communities-en.pdf