进化中的图书馆AI策略(ARL问卷调查及AI素养培训)

美国研究图书馆协会(ARL)在2023年4月和12月,针对火热的生成式人工智能(Generative AI)对成员馆代表进行了两次问卷调查。调查分析报告日前发布:

进化中的图书馆AI策略:来自研究图书馆协会成员代表九个月来的两次调查见解

Lo, Leo S., and Cynthia Hudson Vitale. Evolving AI Strategies in Libraries: Insights from Two Polls of ARL Member Representatives over Nine Months. Washington, DC: Association of Research Libraries, March 2024. https://doi.org/10.29242/report.aipolls2023.

在127个ARL成员馆中,4月的第1次问卷仅收到20个回复(16%),时隔9个月的第2次问卷收到74个回复(58%),显示对AI关注的显著增长。问卷主要关注对AI对图书馆服务的潜在影响的看法,当前AI在其图书馆内的探索和实施程度,以及认为最相关的潜在AI应用,以期全面分析成员馆对图书馆环境中AI集成的态度、策略和预期。两次问卷在基本内容稳定的情况下,第2次问卷对“生成式AI在未来12个月内在研究图书馆中最相关的潜在应用”部分进行了增强,显示出图书馆应用视野的扩大,以及更积极地参与用户指导的趋势,2次问卷此题选项变化如下:

  • a.自动化编目和元数据生成
  • b.用于用户支持的聊天机器人
  • c.个性化内容推荐
  • d.研究数据分析和可视化
  • e.支持AI用户社区【12月新增】
  • f.关于进行AI辅助文献综述的指导和咨询【12月增加“指导和咨询”】
  • g.关于评估生成AI回复准确性的指导【12月新增】
  • h.提示工程指导(Instruction on prompt engineering)【12月新增】
  • i.数字藏品搜索、发现和分析【12月新增】
  • j.其他(请具体说明)

以下摘译部分“调查结果”:

  • 如何描述你对未来12个月图书馆服务中生成式AI技术潜力的看法?(两次调查的比较突显了ARL成员代表对AI的态度发生了重大变化,在九个月的时间里,他们从普遍的谨慎乐观转变为对AI对图书馆的变革力量更有信心)【与社会普遍看法一致】
  • 您的图书馆目前在多大程度上探索或实施生成式AI能解决方案?(对两次调查的比较分析突显了学术图书馆内AI参与格局的重大转变。越来越多的图书馆从探索转向积极实施)
  • 请选择未来12个月内你认为最相关的生成AI在研究图书馆的潜在应用(第2次得到34-35次选择的应用:指导评估AI回复,自动编目和元数据生成,用于用户支持的聊天机器人,支持AI用户社区)
  • 图书馆如何加强其信息素养计划,帮助学生和研究人员更好地理解和评估AI生成的信息?(两次调查演变反映了一种转变,即从简单地想与其他单位合作,到在图书馆工作人员中深入思考AI素养的必要性)
  • 如何描述图书馆员工对生成AI的态度?(各种各样)
  • 从长远来看,预计生成式AI会以何种方式影响图书馆运营和服务?(预计将对图书馆运营和服务产生重大的长期影响:将简化工作流程,提高生产力,并重新定义图书馆员工队伍。然而,他们也认识到需要在乐观与现实之间取得平衡,承认潜在的挑战,如供应商在没有图书馆参与的情况下开发的AI工具。伦理考虑,包括负责任的AI开发和应用,仍然是图书馆在驾驭这一快速发展的技术时关注的重点)
  • 请描述你正在进行的关于生成AI的校园或组织对话的类型,以及图书馆在这些讨论中扮演的角色,例如,保持学术诚信、出版和作者身份、研究诚信等(图书馆在与生成式AI相关的全组织对话和倡议中的作用的演变。两次调查间,许多图书馆从主要专注于创建指南和研讨会转变为积极参与制定机构AI战略。合作的增加和跨学科的方法表明,图书馆在高等教育中驾驭生成式AI的复杂景观方面越来越重要。随着各机构努力应对AI对学术诚信、研究和出版的影响,图书馆处于提供宝贵见解和指导的有利地位。然而,并非所有成员代表都报告参与了其组织举措或对话。这表明,随着图书馆在生成式AI时代继续定义其角色,仍有增长和增加参与的空间)
  • 在过去的九个月里,你对生成AI的看法发生了怎样的变化?(起初许多代表对AI持谨慎乐观的态度,但随着他们获得更多知识,并见证了图书馆部门的真实应用,他们的观点朝着更积极、更明智的方向发展。这种观点的变化可以归因于几个因素,包括对AI工具的接触增加,对该技术的潜在好处和局限性有了更好的理解,以及人们越来越认识到AI将继续存在。随着成员代表更多地参与AI,他们对其可能性更有信心,并开始看到其改变图书馆服务和运营的潜力。然而,对负责任地使用AI以及使生成式AI工具对研究和实际应用有用所需的投资的持续担忧,缓和了这种积极性的增加。成员代表承认,虽然AI有潜力提供巨大的好处,但如果不负责任或不道德地实施,也会带来风险。他们强调图书馆需要批判性地参与AI,并确保其使用符合伦理原则和负责任的做法)

报告最后部分“可采取行动的建议”之一是“开发AI素养计划”——为图书馆员工和用户举办结构化的AI素养讲习班,侧重以下7项能力[引用本报告作者文献/见下],使员工和用户能够自信、负责任地使用AI技术:

  • 1.AI基础:介绍与图书馆服务相关的AI基本概念,包括机器学习和自然语言处理。
  • 2.AI的批判性评估:培训参与者批判性地评估AI生成的信息的准确性和可靠性。
  • 3.AI的伦理使用:讨论算法偏见和数据隐私等道德问题,强调图书馆中负责任的AI使用。
  • 4.AI数据管理:教授AI在数据管理和管理中的作用,强调数据质量的重要性。
  • 5.实际的AI应用:展示AI在图书馆运营中的应用,如自动编目和用户支持。
  • 6.导航AI增强的资源:为用户提供高效使用AI增强数据库和数字图书馆进行研究的技能。
  • 7.持续的AI学习:促进关于AI进步及其对图书馆的影响的持续教育。

[参考文献:评估大学图书馆的AI素养:以美国员工为重点的调查研究] Leo S.Lo,Evaluating AI Literacy in Academic Libraries: A Survey Study with a Focus on US Employees,” The University of New Mexico Digital Repository, 2024, https://digitalrepository.unm.edu/ulls_fsp/203.

薛定谔目录:BIBFRAME是活是死?(附吐槽RDA)

2023年10月,Jeff Edmunds发布文章“BIBFRAME必须死”,参见:BIBFRAME必须死(2023-10-25)

11月他将文章引入BIBFRAME论坛,先后引发多个话题:

  • 11.2-8 Jeff Edmunds [BIBFRAME] BIBFRAME Must DieBIBFRAME必须死
  • 11.8 Karen Coyle [BIBFRAME] Does BIBFRAME improve on MARC?BIBFRAME改进了MARC吗?(介绍2007年她为LC写的报告《MARC记录的未来》)
  • 11.8-9 Timothy Thompson(耶鲁)[BIBFRAME] MARC Must (Still) Die [Was: BIBFRAME Must Die]MARC(仍然)必须 死(数据验证支持差,以规范为例说明数据质量不行[同意])
  • 11.9 Jeff Edmunds [BIBFRAME] If MARC Must (Still) Die, Who’s Going to Kill It, When, and How?如果MARC(仍然)必须死,谁会杀死它,何时以及如何杀死?(BIBFRAME不可行的部分原因是,图书馆缺乏资源来对元数据质量和编目实践进行如此广泛的改进,而这些改进完全基于过去所称的规范控制,现在通常被称为实体管理)
  • 11.9- Johnathon Redmon [BIBFRAME] Marc vs BIBFRAME(美国某公共馆编目助理求入门知识;KC:不是在MARC和BIBFRAME之间做出选择)

2024年2月底,书目概念模型兴趣小组(BCMIG)宣布将在ALA核心的兴趣小组周(https://www.ala.org/core/continuing-education/interest-group-week)召开网会讨论此问题,再度在BIBFRAME论坛引发热议,Jeffrey Edmunds对报告人之一Gloria Gonzalez的EBSCO销售人员身份的质疑更是引发争议。

日前,2024年3月7日书目概念模型兴趣小组会场(Bibliographic Conceptual Models IG session)的会议录像(3个报告50分钟)+聊天记录(共65分钟)已经上网:

会议标题:薛定谔的目录:BibFrame是活是死?(Schrödinger’s Catalog: Is BibFrame Alive or Dead?)

一、“BIBFRAME必须死”:主要论点概要 “BIBFRAME must die”: a synopsis of the primary arguments / Thomas M. Dousa(视频0-14分钟)概述BIBFRAME论坛围绕“BIBFRAME必须死”的讨论。

二、BIBFRAME必须进化-继续:BibFrame需要进行可用性改造 (Continue to bibframe must evolve) BibFrame need a usability makeover (and it’s as easy as abc) / Robert Sanderson(视频14-28分钟)认为BIBFRAME需要降低进入壁垒,平衡可用性和完备性。

三、给BIBFRAME的情书 A Love Letter to BIBFRAME / Gloria Gonzalez(视频28-50分钟)强调图书馆需要BIBFRAME的理由,关于BIBFRAME的5个预测,费用问题;另外也推介了EBSCO产品,包括BiblioGraph和folio。

  • Gloria认为需要BF的理由:[1] 图书馆需要带新用户到图书馆目录,不需要他们先走进目录;[2] 图书馆元数据需要走出目录,在任何应用中可重用;[3] MARC正阻止用户访问图书馆。【对前二者我很认同。不过,对于用户可能不知道“走进目录”的问题主要针对公共图书馆,对学术图书馆不应该是问题(如之前讨论指出的,学术图书馆的很多资源在收费墙后)】
  • 关于BIBFRAME的5个预测:1、将会有Bibframe数据网络集成到一个工具中,帮助人们以新的方式发现图书馆有什么。2、将看到集中化和去中心化服务的混合。3、Bibframe发展到超越基本书目描述来描述其他领域。4、知识图谱将被集成到个性化的发现服务中。5、图书馆将有很多选择,需要图书馆提需求。
  • 对吐槽众多的费用问题:[1]费用和价格在下降;[2]大机构正付费添加此功能;[3]在BF系统与工具上的投资正取得成功(Sinopia, Marva, Libris, FOLIO);[4]开源投资对使BF可支付、可获取关键;[5]必须问自己:不从MARC转到BF会是什么费用?

— RDA躺枪 —

聊天区简直成了新RDA吐槽专场。RSC前主席Gordon Dunsire也在网会,频频为RDA作解释。

摘录若干如下:

  • 对BIBFRAME的质疑/恶意(无论你怎么想)在多大程度上实际上是对新RDA的失望
  • 我对新RDA的看法肯定比BIBFRAME要悲观得多
  • 负担不起RDA工具包……为了可疑的利益,我们/他们将如何负担得起用无法理解的词表进行训练,获得我们负担不起的新系统
  • RDA以最愚蠢的方式推出。他们本可以专注于专著的应用纲要,但没有…他们给了我们…一个本体,并期望人类阅读它…
  • “res”和“nomen”让我觉得非常非常努力地在语言上做到令人难以置信的精确,但却以普遍熟悉为代价

RDA元数据指导文档(MGD):时间段

RDA元数据指导文档(MGD)是美国为实施新RDA,与《美国国会图书馆-合作编目项目政策声明》(LC-PCC PS)配套使用的文档,提供新RDA的详细说明与示例,有助于以新RDA完成编目工作。

MGD包含包括20多个叙述性MGD,200多个一对一MGD,时间段(Timespan)是叙述性MGD之一。

之前写过的MGD相关博文:

Timespan (Official RDA Toolkit — LC-PCC Metadata Guidance Document, 2022-01-31)

【总结】

  • 时间段(Timespan)是《IFLA图书馆参考模型》(LRM)引入的新概念,是新的RDA实体。
  • 在原RDA中,时间(日期,Date)是“属性”。由于新RDA的时间段是实体,与时间有关的元素就成为各实体与时间段实体之间的“关系”。
  • 时间段有2种记录方式:结构化描述,应用扩展日期时间格式(EDTF)或ISO 8601(如:1971-12-19);非结构化描述,转录载体表现显示的日期。(对于元素“时间段标识符”(identifier for timespan),应该归入第3种记录方式“标识符”?)
  • 有关日期/时间段,原RDA和新RDA虽然在概念上有变化,但记录方法没有变化,即编目时做书目/规范记录没有变化。
  • 相关的LC-PCC PS有意保持开放,即不做实质性规定,而是指示编目员应用选项或行使编目员判断。应用“记录由应用纲要指定的元素”选项,意味着编目机构可以建立自己的记录时间段的政策和实践。

元数据指导文档(MGD):时间段

MGD汇总了所有13个RDA实体(包括时间段本身)的时间段相关元素(合计57个):

  • (时间段的)属性 Attribute(3个):类别 category of timespan;附注 note on timespan;相关实体related entity of timespan
  • 命名 Nomen(10个):称谓 appellation of timespan(下位元素3个:access point for timespan,name of timespan,identifier for timespan);检索点 access point for timespan,规范检索点 authorized access point for timespan,变异检索点 variant access point for timespan(用于结构化描述;尚未实施);名称 name of timespan,首选名称 preferred name of timespan,变异名称 variant name of timespan(用于非结构化描述);标识符 identifier for timespan。使用日期 date of usage of(见:Nomen > date of usage);相关 related nomen of timespan(不著录)
  • 时间段 Timespan(7个):开始 beginning / beginning of,结束 ending / ending of;部分 part of timespan / part timespan;相关 related timespan of timespan
  • 作品 Work(7个) :date of work of;纪元 epoch of,春分/秋分 equinox of;主题 subject timespan of;timespan described in;学位年 year degree granted of;相关 related work of timespan
  • 内容表达 Expression(5个):date of expression of,代表性内容表达 date of representative expression of;抓取 date of capture of,date of capture of representative expression of;相关 related expression of timespan
  • 载体表现 Manifestation(7个):date of manifestation of;出版、生产、制作、发行、版权 date of publication of,date of production of,date of manufacture of,date of distribution of(见:Manifestation > date of distribution),copyright date of;相关 related manifestation of timespan
  • 单件 Item(1个):相关 related item of timespan
  • 行为者/集体行为者 Agent(4个): 活动时期 period of activity of agent of,period of activity of collective agent of;相关 related agent of timespan,related collective agent of timespan
  • 个人 Person(4个):生卒日期 date of birth of,date of death of;活动时期 period of activity of person of;相关 related person of timespan
  • 家族 Family(2个):活动时期 period of activity of family of;相关 related family of timespan
  • 团体 Corporate Body(5个)建立、终结 date of establishment of,date of termination of;活动时期period of activity of corporate body of;会议 date of conference of;相关 related corporate body of timespan
  • 地点 Place(1个):相关 related place of timespan
  • RDA Entity(1个):相关 related RDA Entity of timespan