法国国家图书馆人工智能路线图2021-2026

本文译自“法国国家图书馆和人工智能”(BnF and Artificial intelligence,介绍法国国家图书馆(BnF)计划应用人工智能(AI)的5个主要领域、5项行动和6个主要项目

其中5项行动和6个主要项目由《BnF人工智能路线图2021-2026》提出,首发于2021年12月在法国举办的第三届图书馆、档案馆和博物馆人工智能国际会议(AI4LAM, http://www.ai4lam.org/。路线图中有2021-2026各年计划。链接在文末。

—— 法国国家图书馆和人工智能 ——

两者的共同点是什么:在Gallica上查找你弟弟的替身的查询,几种手写音乐符号之间比较以确定复制古代乐谱的抄写员,以及预测BnF馆藏应如何处理以确保其最佳保存的能力?

这三项任务可以得到人工智能(AI)技术的支持。AI应用领域涵盖了图书馆的所有活动和服务,从而开辟了令人兴奋的视角和研究方法。

领域

AI项目可以组织在BnF的五个主要领域。这些领域与其收集、保存、编目和传播数量、种类和历史范围内的杰出馆藏的使命有关:

  • 支持编目活动
  • 馆藏管理
  • 搜索、分析内容并改进对内容的访问
  • 用户参与、正确看待内容
  • 决策和治理

路线图

构建一致、统一和负责任的AI政策

基于AI的处理、开发和项目需要一个一致的政策,能够让本馆内的AI社区参与进来,并解决伦理问题,如人与机器之间关系的演变。为了应对这些挑战,制定2021-2026年的路线图。

五项行动

文件于2021年12月在BnF召开的第三届图书馆、档案馆和博物馆人工智能国际会议上发表,阐述五项行动:

  1. 将AI挑战和项目作为机构全球战略的一部分
  2. 改进BnF的研发组织和实施
  3. 培养新技能
  4. 调整基础设施和数据管理
  5. 与其他利益攸关方一起设计一个多年期方案

重点项目和实验

路线图中描述的多年计划汇集了六个关键项目,这些项目势必将AI纳入图书馆的日常流程和服务。这种一体化需要从试验转向工业化。这就是Gallica(https://gallica.bnf.fr/)图像挖掘项目的全部内容。在该项目中,IIIF和机器学习等技术被用于定位和检测任何类型的文档(书籍、报纸等)中的图像,并添加标签或分析视觉内容,以促进数字馆藏的探索。与图像挖掘一样,BnF所有涉及AI的举措都依赖于BnF现有的工具和当前的项目。例如,它们与正在创建的新编目应用(称为NOEMI)有关,以确保书目转换,或与物品的物理管理和在亚眠(法国北部)建造新的保存建筑有关。

路线图的六个主要项目如下:

  • Gallica的图像挖掘(基于相似性和生成的关键字查询Gallica中的图像)
  • 将手写文本识别(HTR)集成到Gallica中(这项技术适用于手写文本,也适用于古代印刷作品和以罕用口语书写的文本)
  • 编目(日常编目支持、自动化机制的扩展和改进、实施LRM模型…)
  • 从伦理角度进行个性化内容推荐(也就是说,尊重多样性、数据隐私…)
  • 识别网络档案中的自主文档(学术文章、官方出版物等可以被AI在庞大的网络档案库中检测到,元数据可以被提取出来,以创建和丰富图书馆目录中的基本记录…)
  • 馆藏保护和管理的监测工具:该项目与物品管理和亚眠未来的保护点密切相关。AI协助图书馆员进行相关处理,以更好地保存损坏或易碎的文件,并准备书库和储藏室的设计等。

与这些项目相关的实验不断进行,但也通过其他机会(特别是在研究伙伴关系方面)进行。从这个角度来看,BnF数据实验室(BnF DataLab)被证明是一个重要的支持。

归档网上与AI相关内容

BnF不仅实施AI技术来处理和传播其馆藏:作为其法定呈缴任务的一部分,它还捕获网络上与AI相关的资源。例如,在2021年夏天,图书馆的爬虫收集了700多个由工作人员选择的网站或推特账户,总计超过1000万个URL。有关AI的伦理问题和社会经济后果,以及A[I]的科学和艺术用途或文学实验的资源都包含在本收藏中。

联系:DEPOT.LEGAL.WEB@BNF.FR

插图:C.Ardenti 和 L.Giocanti【文中图略】

资源

BnF Roadmap on AI, 2021-2026

  • 路线图 Roadmap: a visual summary (PDF下载)https://www.bnf.fr/sites/default/files/2022-01/Poster_AI%20Roadmap_BnF_202112.pdf

AI at the BnF , in libraries, in cultural institutions

  • 追随AI脚步的BnF数字路线图中的终极旅伴 BnF and AI: an itinerary through the fundamentals of AI. https://www.bnf.fr/en/mediatheque/ultimate-travel-companion-bnf-digital-roadmap-footsteps-artificial-intelligence-ai
  • 奇妙的未来2021:第3届AI4LAM国际会议 “Futurs fantastiques” 2021: 3rd international conference about Artificial Intelligence in Libraries, Archives and Museums. https://www.bnf.fr/en/les-futurs-fantastiques

图书馆读者的称呼

对图书馆的服务对象,国内一般通称“读者”。现在到图书馆不一定为读书,所以有时也称“用户”。在英语中reader已经很少用,常见的是patron或user。对于英语的不同称呼是否有含意差异,一直没有感觉。

之前介绍的ALA报告中,提到Z世代和千禧一代使用图书馆的人不自认为是读者(reader)。上纽大的网友发来一篇《American Libraries》网站2012年的文章,分析patron、customer、user和member这4种称呼的内在差异。

  • 我们服务谁?顾客?用户?客户?名称预示着互动

Just Whom Do We Serve? Patrons? Users? Clients? The name foreshadows the interaction. American Libraries, 2012-3-28. https://americanlibrariesmagazine.org/2012/03/28/just-whom-do-we-serve/

文章称,“图书馆工作人员如何看待library patron反映了我们的哲学世界观”。文中提到读者时交替使用patron和user,表明customer以及member并不常用,而标题中的client则没有在正文中出现(应当指customer)。

  • patron(顾客/主顾/赞助人):“将library user视为顾客的世界观是顾客(捐助者)凌驾于图书馆之上的世界观。根据这种世界观,我们应该为他们支持我们的工作而感到幸运,我们永远感激他们。”。
  • customer(客户):“客户需要我们所拥有的,但我们不需要它们”,“他们处于我们之下。”
  • user(用户):“用户是消费而不创造的人。这种世界观并不承认他们因为图书馆而创造的一切”。用户“必须拥有图书馆提供的东西,但我们不需要他们。”
  • member(成员/会员):某馆有顾问作读者调查,半数以上受访者回答说,与其称“patron”、“customer”或“user”,不如称“成员/会员member”。“将图书馆用户视为“成员”的世界观意味着什么?成员资格意味着所有权和积极作用;他确实与图书馆工作人员建立了一种相互依存的关系。”

作者大力推荐member称呼,在文章最后部分畅谈在普通读者证之外实施收费的“首选会员卡”的设想:

  • “与其他组织、机构和企业一样,图书馆也应考虑实施首选会员卡计划。这张首选会员卡可以通过年费购买,并享有津贴和特权。例如,为普通图书馆会员购买热门新畅销书,为首选会员购买额外副本。也许首选成员不会受到逾期罚款,或有权延长借阅期限,在荣誉榜上被引用,或被邀请参加特别聚会?首选会员卡可以成为更大的会员和筹款活动的一部分。”
  • “普通顾客通过首选会员提供的资金获得更多资料和服务,而首选会员则因经常使用图书馆而获得奖励,并因成为图书馆支持者而获得认可。”

参见:ALA报告:Z世代和千禧一代正在访问图书馆,更喜欢印刷书籍(2023-11-6)

ALA报告:Z世代和千禧一代正在访问图书馆,更喜欢印刷书籍

美国图书馆协会(ALA)本月发布一份报告《Z世代和千禧一代:他们如何使用公共图书馆并由媒体使用表明身份》。

注1:所谓Z世代(Gen Z)和千禧一代(Millennials),在本报告中指2022年调查时13-40岁者。不同机构使用“世代”的概念可能有一两年的差别,如皮尤研究中心定义的千禧一代、也称Y世代出生于1981-1996年间,Z世代出生于1997-2012年间。出生于1965-1980年间的为X世代;拉丁字母用完,出生于2010年代到2025年间的为Alpha世代

注2:标题中的“表明身份”(Identify)指阅读者、游戏玩家、创客、粉丝(readers, gamers, makers, fans)等标签。

不知道为什么,ALA新闻对此报告的欣喜,反而让我觉得美国公共图书馆的使用似乎不那么频繁:调查2075人,一半以上的人一年内到过图书馆,不论次数?比年长者去得更多?而喜欢印刷书籍,不要想多了,似乎更多是绘本和漫画。

(ALA新闻)ALA报告:Z世代和千禧一代正在访问图书馆,更喜欢印刷书籍

New ALA report: Gen Z & Millennials are visiting the library & prefer print books. 2023-11-1.

今天发布的一份新报告,与老一辈人相比,Z 世代和千禧一代正在以更高的比例使用公共图书馆,无论是面对面还是数字。《Z世代和千禧一代:他们如何使用公共图书馆并由媒体使用表明身份》利用一项具有全国代表性的调查,揭示了美国年轻人对图书馆使用和媒体消费的态度和行为。

该报告和调查数据由波特兰州立大学的 Kathi Inman Berens 博士和 Rachel Noorda 博士撰写,显示 54% 的 Z 世代和千禧一代在过去 12 个月内访问过实体图书馆。在 2022 年接受调查的 2075 名 Z 世代和千禧一代中,超过一半的自我报告访问过实体图书馆的人表示,他们也从图书馆的数字馆藏中借阅。数据还显示,年轻的美国人对实体版书籍的明显偏好:受访者平均每月阅读和购买的纸质书籍数量是其他类别书籍的两倍。

“好消息是:年轻一代的人正在读书、买书和访问图书馆”,Noorda 博士说。Z世代和千禧一代不仅与书籍互动,而且还与其他形式的媒体互动。他们是游戏玩家、读者、写作者和粉丝,他们对媒体类别和形式之间的延展性感到满意。

图书馆甚至吸引了那些不自认为是读者的Z世代和千禧一代。在过去 12 个月中,43% 不认为自己是读者的 Z 世代和千禧一代中,超过一半的人去过当地的图书馆。

……

(ALA报告)Z世代和千禧一代:他们如何使用公共图书馆并由媒体使用表明身份

Gen Z and Millennials: How They Use Public Libraries and Identify Through Media Use / Kathi Inman Berens and Rachel Noorda. 2023-11

报告概要摘录:

  • 54%的Z世代和千禧一代在12个月内访问了实体图书馆。
  • 23%的Z世代和千禧一代在12个月内访问过实体图书馆,但并不认同自己是读者。
  • Webtoon(网络漫画)、Radish(言情电子小说)和Audible(有声读物)等应用程序中提供的仅限订阅和/或移动独家内容特别受Z世代和千禧一代的欢迎:12%的Z世代和8%的千禧一代订阅网络漫画,30%的Z世代、38%的千禧一代订阅Audible。但订阅内容,如Audible独家品种,大多不可供图书馆许可。
  • 52%的Z世代和千禧一代实体图书馆用户表示,他们从图书馆的数字馆藏中借阅。
  • 黑人(58%)和拉丁裔(57%)实体图书馆的读者使用数字馆藏的比例高于普通调查人群(52%)。
  • 数字图书的漫长等待时间对黑人、原住民和有色人种的不利影响超过了普通人群。47%的Z世代和千禧一代黑人(不仅仅是实体图书馆的读者)使用过数字馆藏,而普通人群的这一比例为37%。
  • 75%的Z世代和千禧一代实体图书馆用户认为,图书馆等待一周或更短时间是“漫长的”。
  • 图书馆的青少年活动室是安全、舒适的空间,支持:放松,心理和社会康乐,受学校和教育授权约束的学习
  • 如果有选择,59%的Z世代和千禧一代会选择故事的绘画/漫画版,而不是纯文本的书:黑人(69%)和拉丁裔(73%)社区更喜欢绘画/漫画版本,而不是纯文本的书。