2023年IFLA年会的图书馆数据主题

国际图联(IFLA)的信息技术部、主题分析和检索部、编目部,目前正联合为2023年年会分会场征文,关注机器学习背景下的元数据相关问题。

主题是:机器学习世界中的图书馆数据:伦理、偏见和算法

显然这是目前国际关注的热点。摘译征文说明如下;提交细节在原文链接最后,略过未译。

Call for Papers — Open Sessions : Library data in the world of machine learning (2023-3-28)

IFLA信息技术部<https://www.ifla.org/units/it/>,主题分析和检索部<https://www.ifla.org/units/subject-analysis-and-access/>和编目部<https://www.ifla.org/units/cataloguing/>正在寻求在荷兰鹿特丹举行的2023年国际图联世界图书馆和信息大会联合公开会议上提交的论文。

主题:“机器学习世界中的图书馆数据:伦理、偏见和算法”

图书馆通过其专业知识,利用内容专业知识、专业数据标准、图书馆和数据工作流程以及以用户为中心的伦理框架内的技术工具,将信息的可发现性和可访问性放在首位。然而,这些专业做法并不是一成不变的;事实上,它们正在迅速发展,以在新系统和标准、新数据模型和格式以及新网络技术的环境中保持一致,所有这些都需要更新技能才能保持最新。

本次会议由信息技术部、主题分析和检索部以及编目部联合主办,旨在探讨这一演变带来的挑战和机遇,并强调世界各地图书馆正在使用的伦理问题、实用方法和技术解决方案。我们欢迎对元数据和技术交叉领域的工作进行案例研究,特别关注解决机器学习提出的主题的演示,如负责任的数据创建/管理、解决描述中的偏见以及平衡人类智力工作与算法和自动化的力量。

我们希望邀请您就以下分主题发表演讲或论文:

  • 机器学习应用于图书馆环境中数据的伦理意义
  • 平衡图书馆数据工作中的伦理考虑与高效流程
  • 历史元数据问题——对机器学习的影响和通过机器学习进行补救
  • 人工智能和关联数据/语义网工具如何应用于转换数据检索和发现的示例
  • 调查工作人员在工具和技术的伦理使用方面的技能和知识的能力建设
  • 准备和提供用于机器学习环境的伦理数据的方法
  • 介绍在伦理框架内使用的工具或软件
  • 对实验进行得不太顺利的反思;学到了什么?

日本高校联编系统采用OCLC的Syndeo

日本国立情报学研究所(NII)的 NACSIS-CAT/ILL 是日本高校图书馆的联合编目和馆际互借系统,始于1984年,现有1339成员图书馆,汇集1345万书目记录和1.5亿馆藏记录。

2021年NII启动更换原有系统,采用OCLC的Syndeo元数据服务软件,由OCLC在日本的分销合作伙伴纪伊国屋公司实施。2023年初新平台如期发布,“新系统可容纳多种元数据类型,包括MARC21和CAT-P,这是日本使用的一种独特格式”。

纪伊国屋新闻提到未来支持BIBFRAME:

新系统基于受控书目服务 (CBS),它是 OCLC 元数据基础设施服务群“Syndeo”的一个组件。该系统专为区域和国际合作而设计,已在荷兰、德国和法国等欧洲国家以及澳大利亚实施。日本的这一实施将与传统 CAT-P 格式的每个图书馆一起工作,并保持当前的 NACSIS-CAT/ILL 功能。另一方面,系统内部持有符合国际目录格式MARC21的数据,同时也在考虑未来支持RDA、BIBFRAME等国际元数据标准。此外,馆际互借(ILL)服务由CMS公司打造,与CBS实现无缝连接。

NII新闻对系统升级背景等有详细阐述,并称这是迈向国际化的新一步:

通过为 NACSIS-CAT 的底层系统使用国际包,在NACSIS-CAT/ILL中管理的元数据以与MARC21而非CATP互操作的格式进行维护。这种措施的一个优点是它确保了未来的可扩展性和普遍性。此外,我们停止了Web普及之前的旧标准Z39.50网关功能,并开始提供在HTTP/HTTPS上运行的后继标准SRU(通过 URL 搜索/检索)网关功能

今后,与国际标准编目规则 RDA(资源描述和检索)相对应的“日本编目规则2018 ”(NCR2018 )的NACSIS-CAT/ILL应用,目前委员会正在研究考虑中。

参见:

OCLC新闻:OCLC to provide new national cataloging platform for libraries in Japan(2021-6-17)

OCLC新闻:New national cataloging platform for libraries in Japan is launched using OCLC’s Syndeo(2023-3-30)

纪伊国屋公司新闻:紀伊國屋書店が構築を受託した『新しい目録所在サービス(NACSIS-CAT/ILL)』が本稼働しました(2023-3-30)

NII新闻:大学図書館等の目録所在情報サービス(NACSIS-CAT/ILL)新システムでメタデータの国際流通へ新たな一歩をふみだす(2023-3-30)

参见:Syndeo® https://www.oclc.org/en/syndeo.html

PCC 2023-2027战略方向

PCC Strategic Directions, 2023-2027 (March 9, 2023)

《PCC战略方向,2023-2017》最新发布。前几次可参见:

没有和前几次的战略规划/战略方向细致对照,仅就感觉粗略查了下,以下几点或可视为新动向:

1、多样、公平和包容(diversity, equity and inclusion,简称DEI),这是美国近年最重要的“政治正确”。除在使命(Mission)中提DEI外,专设SD6,与残障友好的“可及”合并称ADEI(Accessibility, Diversity, Equity and Inclusion),并说明其他SD也体现ADEI原则。

  • 在编目(元数据)领域,主题词表特别容易有这方面的问题。6.5专述此方面行动,术语“批评编目”(critical cataloging)“修复编目/描述”(reparative cataloging/description)

2、技术多元化(pluralism)。前些年强调关联数据、目标是替换现有元数据实践,现在则强调技术多元、即新旧并存,认可MARC有相当长的过渡期。当然,关联数据的发展方向并未改变。

  • 5个行动:2.1映射;2.2身份/实体管理,URI、协调服务(reconciliation services);2.3 RDA,政策声明、元数据指导文件等;2.4更多词表;2.5 MARC改进:主动废止重复和/或未充分利用的元数据编码做法(例如,在MARC记录的其他地方重复信息的固定字段);在废止不可行时,鼓励开发元数据编辑工具,最大限度地减少重复的人工数据输入。

3、Share-VDE(虚拟发现环境),Share Catalog进化而来的联机目录,应用BIBFRAME。转换到关联数据/BIBFRAME之后,PCC需要联合目录库,这就是PCC数据池,采用Share-VDE。相关博文:https://catwizard.net/page/6?s=share+vde

4、编目减员严重,希望招募(图书馆外的)元数据从业者和LIS研究生参与PCC项目。

此外,由文件可见PCC的各种委员会,6个战略方向(SD)有各自的具体行动(Actions),分别由一个或多个委员会承担:

  • 政策委员会 PoCo(Policy Committee)
  • 标准常设委员会 SCS(Standing Committee on Standards)
  • 应用常设委员会 SCA(Standing Committee on Applications)
  • 培训常设委员会 SCT(Standing Committee on Training)
  • 关联数据咨询委员会 LDAC(Linked Data Advisory Committee)
  • 身份管理咨询委员会 IMAC(Identity Management Advisory Committee)
  • 多样公平包容咨询委员会 DEIAC(Diversity, Equity and Inclusion Advisory Committee)

—— PCC 2023-2027战略方向 ——

以下为6个SD(战略方向),省略其下具体行动(Actions)。

  • SD1:与更广泛的元数据利益相关者社区接触

随着PCC在其历史上面向内部和MARC 21的重点之外采取进一步措施,它必须在一致的基础上与更广泛的社区接触。近年来,它已经开始与ISNI(国际标准名称标识符)、Share-VDE(共享虚拟发现环境)和其他社区建立合作伙伴关系,并尝试和试行超越历史MARC限制的重新构想的元数据实践。在接下来的几年里,PCC必须加强努力,与符合其目标的其他组织合作。这包括GLAM(画廊、图书馆、档案馆和博物馆)元数据社区,以及非GLAM和供应商社区。此外,用户体验(UX)因素必须成为图书馆元数据规范未来发展的驱动因素。PCC必须采取积极主动的措施,打破功能竖井/谷仓,更直接地满足我们所描述的资源用户的发现需求。

  • SD2:促进技术多元化和持续相关性的文化【关联数据与MARC并存】

近年来,图书馆元数据实践开始多样化,一些机构采用关联数据技术,而另一些机构在可预见的未来将在很大程度上保留基于MARC的工作流程。并非所有机构都能或希望在这一过渡期以同样的速度接受新技术,但PCC必须欢迎新兴实践的早期采用者和既定实践的维护者的参与并支持他们的需求。在这个技术多元化和人们对关联数据原则越来越感兴趣的时代,元数据的可共享性至关重要。PCC应在未来几年集中精力促进元数据的互操作性,并继续淡化虚幻的“完美”书目或规范记录的化妆品方面。一个相关的、可持续的合作项目是指我们的集体智力和增值工作得到尽可能有效和可扩展的利用。

  • SD3:增强合作项目的活力【招募(图书馆外的)元数据从业者和LIS研究生参与PCC项目】

随着编目/元数据部门因退休和自然减员而持续缩减,(当前和未来)PCC参与者的人才库受到负面影响。PCC有着通过其漏斗计划邀请更广泛的贡献者参与的既定记录,与正式机构成员相比,漏斗计划已经通过降低生产要求降低了进入门槛。也就是说,由于元数据工作的性质正在演变,PCC仅根据MARC记录统计来衡量贡献已经没有意义了。此外,PCC应该加倍努力,招募更大、更多元化的人才库,他们不仅能够通过元数据制作做出贡献,而且也可以在PCC的组织结构中任职。通过这样做,PCC将有助于培养未来几代的领导者。

  • SD4:变换PCC形像

PCC在编目和元数据专业知识以及高质量MARC元数据的生产方面建立了坚实的声誉。然而,其许多最活跃的成员来自少数(大多规模较大、人员配备充足、资金充足)机构。因此,来自较小和/或更专业机构的同事,以及来自美国、加拿大和英国以外机构的同事可能认为自己没有体现在PCC的目标中。此外,如上文SD2所述,近年来,图书馆元数据实践已开始多样化,一些机构采用关联数据技术,而另一些机构在可预见的未来将在很大程度上保留基于MARC的工作流程。PCC必须被视为一个“大帐篷”,在这里,专业知识、可培训性和为集体利益工作的意愿比机构“血统”更重要,是成为成员和领导的先决条件。PCC本身的关注点不断扩大,也为重塑其形象和品牌提供了机会。它的四个组成项目植根于MARC记录制作,但PCC的工作不再局限于这些核心活动。现在是PCC重新考虑如何在更广阔的世界中最好地代表自己的时候了。

  • SD5:评估和改进PCC存储和共享知识的方式【文档保存,版本控制、档案价值;推广使用,不同访问方式;交互式学习+自我评估+寻求帮助】

PCC拥有强大的集体智慧和记忆力,在考虑未来的政策和优先事项时,它经常被要求利用这些智慧和记忆力。保存和管理这些丰富的知识有时很难。PCC网站(由国会图书馆PCC秘书处维护)最近补充了一个(可协作编辑)wiki,可用于组织更短暂的知识。为了优化这一环境,现在需要进行有意的全面评估。其次,PCC的集体记忆主要保存在Word和PDF文档中。由于该信息的索引和组织不一致,因此该信息的存档价值存在漏洞。展望未来,PCC应探索多种方法,不仅为了子孙后代的利益,保留其关于图书馆元数据实践的长期知识,而且为多元文化和多语言受众有效地打包当前内容。随着元数据实践本身的不断多样化,围绕这些实践传递技能和知识的方法也必须多样化,以跟上当今的可访问性和可用性规范。

  • SD6:通过可及、多样、公平和包容(ADEI)原则来评估和改进PCC的运作【新成立DEI咨询委员会】

作为其上一个战略计划的一部分,PCC委托成立了一个新的多样公平包容咨询委员会(DEIAC)。该小组已经在PCC运营的所有领域推进ADEI理想方面取得了重大进展。随着该小组的成熟和继续开展工作,PCC将出现一种新的文化和运营模式。必须不断评估和更新这一范式,以跟上全球ADEI工作的快速发展。因此,这一战略方向是对先前工作的延续和加强,而不是一个全新的领域。本文件中描述的其他战略方向也包括适用的ADEI原则。