2025年LC正式实施BIBFRAME(及非拉丁字母文献编目变化)

2024年下半年起,美国国会图书馆(LC)部分编目员开始直接用BIBFRAME编目,然后转换为MARC格式记录供使用(应该不久就可以在LC目录中看到转换记录)。2025年3月LC实施FOLIO和BIBFRAME,7月完全切换到FOLIO,现在的图书馆集成系统Voyager退休,意味着届时所有出自LC的MARC记录都由BIBFRAME转换生成。

之前LC的MARC数据的字符集为marc-8,只支持部分语言文字,随着更换到FOLIO,将使用unicode字符集,支持所有语言文字。加之元数据格式由MARC转为BIBFRAME,非拉丁文字编目政策因之而变。2024年4月,LC发布消息(Cataloging, Acquisitions News, 04/25/2024. https://www.loc.gov/aba/news/),为准备2025年春季在LC实施BIBFRAME,作为LCAP(图书馆馆藏访问平台)FOLIO实施的一部分,采访和书目检索局(ABA)将采用[新的]非拉丁文字输入书目描述的最佳实践,并附3个文件,分别是通告、建议报告和政策问题文件:

  • 通告(2024-4-15)Announcement(PDF : 159 KB) 分阶段实现BIBFRAME和LCAP/FOLIO中输入非拉丁文字(2025年内,分季度实现不同语种的非拉丁文字的原文录入,使用LC开发的开放获取的罗马化工具ScriptShifter:参见:2024夏BIBFRAME更新论坛. https://catwizard.net/posts/20240712092615.html
  • 政策问题文件(2023-11-3)Policy Issue Document(PDF : 174 KB)FOLIO BIBFRAME中非拉丁文字输入的政策问题 (LC遵循《PCC多字符集书目记录创建指南》,使用MARC模式A,即非拉丁文字信息记录在880字段中,音译记录在常规MARC字段中。但自2017年开始的BIBFRAME编辑器试验中,非拉丁文字输入一直遵循MARC模式B(对应于MARC就是直接使用常规字段),书目描述是在实例中用原始文字,在作品中提供拉丁音译的检索点。/ 应考虑恢复实施MARC前在旧目录卡上描述非拉丁文字条目的方法,条目包含原始文字中的信息,检索点和正题名以音译形式呈现。以此简化书目描述的创建和结构,节省键入音译数据的资源,满足日益全球化的图书馆生态系统中非拉丁文字用户的需求。此外,以音译提供适当的检索点和正题名,确保图书馆资料的组织和安排,以及规范检索点的维护。)
  • 建议报告(2024-5-8)Recommendation Report(PDF : 980 KB) 关于在BIBFRAME和FOLIO中非拉丁文字输入的建议(最佳实践草案,解决2023年“政策问题文件”中提出的2个问题:1)制定一项关于BIBFRAME描述中包含的音译数据范围的政策,2)确定生成音译数据的解决方案,促进BIBFRAME-MARC转换。/ 音译数据范围:实例:对应MARC字段245/264的信息,作品:检索点如首选题名[MARC字段130/240]。/ BIBFRAME输入采用MARC模式B,但为满足编目服务发行部(CDS)客户[购买LC书目记录的图书馆]的需求,需要为BIBFRAME-MARC转换的描述性元数据生成成对的音译字段。建议采用两种方法提供音译数据:ScriptShifter自动音译;没有自动化工具时字段空白、使用<>作为占位符。/ 附录为示例:多语种BIBFRAME格式;MARC音译占位方式)

由于是在2025年内实施到位,对其他图书馆来说,LC的三阶段实施细节不太重要,主要是了解建议的书目数据细节(还不是最后决定)。后附一条记录,直观感受变化。

尽管国内大量套录源自LC的书目记录,但小语种记录来自LC的不多,估计不会有太大影响。只是现在开始LC记录将逐步过渡到BF转换成的MARC,也需要关注下载记录的变化,确定应对方法。随着明年中Voyager的退休,数据套录方式肯定也会变动,同样需要关注。

— 找一条中文文献记录对比看变化 —

目前由BIBFRAME转换的MARC记录,是考虑其他图书馆需求的折中方案,但结果并非MARC模式A——不是所有原文字都使用880字段:只有规范检索点用音译,不用音译时直接使用相应字段。可以看到转换后的记录880字段少了很多。曾亲眼见证转换程序的变化,如2021年6月的 bibframe2marc v1.1.0 转换结果是BIBFRAME采用的MARC模式B,完全不用880字段,可参见:BIBFRAME/MARC数据双向转换程序更新(880字段消失). https://catwizard.net/posts/20210620124221.html

1、LC目录(https://catalog.loc.gov/)查中文文献记录(输入汉字,如:上海),找一条看MARC记录(申報自由谈)。记录010字段LCCN号=82185853 或 001字段书目号=4232950(用于查找Bibframe2Marc对比记录)

  • 130 0_ |6 880-01 |a Zi you tan.
  • 880 0_ |6 130-01/$1 |a 自由谈.【BF转换记录无:1XX检索点不做原文】
  • 245 00 |6 880-02 |a Shen bao Zi you tan.
  • 880 00 |6 245-02/$1 |a 申報自由谈.
  • 246 30 |6 880-03 |a Zi you tan【BF转换记录无:2XX描述仅照录、不做罗马化(尽管通常246/247也是检索点)】
  • 880 30 |6 246-03/$1 |a 自由谈
  • 260 __ |6 880-04 |a [Shanghai] : |b Shanghai tu shu guan ying yin, |c 1981.
  • 880 __ |6 260-04/$1 |a [上海] : |b 上海圖書館影印, |c 1981.
  • 500 __ |6 880-05 |a Incomplete reprint of the literary section, zi you tan , of the daily shen bao . Originally published: shang hai, 1911-1949. Reprint ed., with new pref., includes only issues for Dec. 1, 1932 – Oct. 31, 1935 and Oct. 10-31, 1938.【BF转换记录无:5XX描述仅照录、不做罗马化】
  • 880 __ |6 500-05/$1 |a Incomplete reprint of the literary section, 自由談,of the daily 申報.Originally published: 上海, 1911-1949. Reprint ed., with new pref., includes only issues for Dec. 1, 1932 – Oct. 31, 1935 and Oct. 10-31, 1938.
  • 505 0_ |6 880-06 |a Shang. 1932nian 12yue 1ri-1934nian 4yue 25ri–xia. 1934nian 4yue 26ri-1935nian 10yue 31ri, 1938nian 10yue 10ri-1938nian 10yue 31ri.【BF转换记录无:5XX描述仅照录、不做罗马化】
  • 880 0_ |6 505-06/$1 |a 上. 1932年12月1日-1934年4月25日–下. 1934年4月26日-1935年10月31日, 1938年10月10日-1938年10月31日.
  • 630 00 |6 880-07 |a Shen pao.
  • 880 00 |6 630-07/$1 |a 申報.【转换无,6XX检索点不做原文】

2、BIBFRAME工具:BIBFRAME2MARC转换工具https://id.loc.gov/tools/bibframe/comparebf-lccn)v2.6【调整顺序880字段到配套字段下】

  • 130 0 $aZi you tan.$0http://id.loc.gov/resources/hubs/36aebe4e-1991-3a2b-d7fe-f6387a551327【检索点,罗马化+$0规范,不做880】
  • 245 00 $6880-01$aShen bao Zi you tan
  • 880 00 $6245-01/$1$a申報自由谈
  • 246 10 $a自由谈【不做880】
  • 264  1 $6880-11$a[Shanghai]$bShanghai tu shu guan ying yin$c1981
  • 880  1 $6264-11/$1$a[上海]$b上海圖書館影印$c1981
  • 500  $aIncomplete reprint of the literary section, 自由談,of the daily 申報.Originally published: 上海, 1911-1949. Reprint ed., with new pref., includes only issues for Dec. 1, 1932 – Oct. 31, 1935 and Oct. 10-31, 1938.【不做880】
  • 505 0 $a上. 1932年12月1日-1934年4月25日–下. 1934年4月26日-1935年10月31日, 1938年10月10日-1938年10月31日.【不做880】
  • 630 4 $aShen pao.$1http://id.loc.gov/resources/hubs/39380c58-e2da-603d-076c-441b383c6718【检索点,罗马化+$1实体URI,不做880】
  • 884  $aDLC bibframe2marc v2.6.0 (MarkLogic Corporation) $g20240714211322.0 $qDLC $uhttps://github.com/lcnetdev/bibframe2marc【转换信息】

图书馆AI用例(机器学习)

国际图联关于图书馆与人工智能的声明(2020),附件中介绍了很多早年应用,还提供了2个额外来源(引用形式经本人修改):

  • 62 AI FOR LIBRARIANS: AI use cases / curated by Pirjo Kangas. https://www.aiforlibrarians.com/ai-cases/
  • 63 Wheatley and Hervieux. Artificial intelligence in academic libraries: An environmental scan. Information Services & Use, 39(7):1-10, October 2019.

AI FOR LIBRARIANS网站的“AI用例”,目的不是完整搜罗,而是列出不同类型的示例,提供介绍链接。

作者Pirjo Kangas(芬兰人)2019年在马里兰大学作为富布赖特学者期间,参与了一个专业项目,研究图书馆中的人工智能(AI)用例,当时AI主要是机器学习。主要收录欧美2018-2019年的案例,后续未更新,且相当部分链接已失效,但仍有参考价值。从中可以看到多次出现的“明星”,如芬兰赫尔辛基中央图书馆Oodi、仍在发展的 Annif,其中的美国罗德岛大学图书馆 AI实验室依然在开展活动。

另参见:自动主题标引工具Annif(2024-2-25)

— AI use cases(AI用例) —

[一] 与图书馆工作流程链接的项目【馆内工作】

  • 自动主题索引/分类:

Annif(芬兰国家图书馆)机器学习和杜威十进分类法(挪威国家图书馆):A) 会议报告(NKOS 2019),B) 会议论文(IFLA WLIC 2018)

  • 机器人:

Oodi 虚拟信息助手 (芬兰赫尔辛基中央图书馆,Headai公司开发):A) Medium 上的客户案例,B) 会议论文(IFLA WLIC 2019)【移动应用程序,六个独特的基于AI的推荐器,为不同类型的读者提供阅读建议】

  • 探索/搜索

Iris.AI

Yewno【链接失效】

Pubmed:训练相关性搜索算法

  • 机构库

哈姆雷特(麻省理工学院学位论文集)【推荐相似论文;停留在阿尔法阶段】

JYX 存储库中的自动主题索引 (Annif):会议论文(2018 年)

  • 物流

芬兰赫尔辛基市图书馆的人工智能智能物流管理系统【链接失效,略】

  • 剔旧

自动分类剔旧候选馆藏方法的研究评估(来自美国维思大学的数据集):A) 硕士论文,B) 期刊文章(非开放获取)【训练六个机器学习分类器,以预测每个候选馆藏的“保留”或“剔除”的剔旧决策】

[二] 与图书馆支持其社区的人工智能技能/意识相关的项目【“AI素养”教育】

  • 支持人工智能教育的图书馆

加拿大多伦多图书馆提高公众对AI和LM的认识 【链接失效,略】

  • 支持 AI 探索的图书馆

美国罗德岛大学图书馆 AI实验室【依然存在……】

美国弗里斯科公共图书馆 创客套件【链接失效,略】

  • 图书馆内的AI项目

斯坦福图书馆 图书馆 AI 计划【链接失效,略】

[三] 艺术项目

  • 在图书馆空间中使用AI的艺术项目:

笑屋(美国剑桥公共图书馆,2018)【链接失效,略】

图书馆的其他智能(芬兰赫尔辛基Oodi,2019)

国际图联关于图书馆与人工智能的声明(2020)

不意看到国际图联(IFLA)关于图书馆与人工智能的声明,IFLA理事会2020年9月17日同意。作者是信息获取自由和言论自由委员会(FAIFE),不侧重技术,仍然具有其价值。声明还有3个附件,记录了丰富的早期应用实例。摘录存档如下【机译为主】。

IFLA Statement on Libraries and Artificial Intelligence. https://repository.ifla.org/handle/123456789/1646

人工智能(以下简称“AI”)和机器学习在私人和公共领域的应用正在迅速增长。本政策声明旨在概述在图书馆部门使用这些技术的关键考虑因素,并建议图书馆在人工智能日益融合的社会中应努力扮演的角色。

人工智能技术可以具有深刻的变革能力,它们的力量可以用于公益和创新服务。有了必要的准备——考虑到伦理问题和当前的局限性——图书馆可以负责任地使用人工智能技术来推进其社会使命。

  • 图书馆中的人工智能:将人工智能和机器学习技术融入日常工作。……[略]
  • 图书馆可以教育用户有关人工智能的知识,并帮助他们在更广泛地使用人工智能的社会中茁壮成长。……[略]
  • 图书馆可以支持高质量、合乎伦理的人工智能研究。……[略]

图书馆需要什么才能成功适应?

人工智能的变革性意味着,随着技术格局的变化,图书馆需要能够利用新资源,适当调整服务以满足不断变化的社会需求。

为此,图书馆员可能会受益于对技术前景的更多认识。由于人工智能可以显著重塑该行业的就业,他们可能还需要接受培训,以适应工作场所角色的可能转变。值得注意的是,不同部门的图书馆可能会受到不同的影响——例如,政府、法律和其他特殊图书馆可能会更加重视以知识为基础的服务提供。

图书馆需要具备采用和利用人工智能所需的法律、基础设施和技术。版权框架中的文本和数据挖掘例外对于图书馆继续履行使命并积极参与人工智能社区至关重要。

Recommendations 建议

基于上述情况,IFLA向政府、图书馆和图书馆协会提出以下建议:

各国政府(以及适当的政府间组织)应:

  • 在版权框架中包括文本和数据挖掘例外
  • 确保图书馆或图书馆网络具有所需的基础设施和能够采用和利用人工智能技术的技术。
  • 确保人工智能的任何监管都能保护隐私或公平原则,同时也能支持创新和公共利益目标。
  • 确保图书馆参与跨部门人工智能计划和战略的制定和实施。

图书馆协会和图书馆培训提供者应:

  • 支持图书馆专业人员了解人工智能的影响及其与隐私和伦理原则的交叉点。图书馆培训提供者应确保图书馆员能够发展相关的数字技能和能力。
  • 倡导图书馆在改变教育系统方面发挥更大作用,因为它们适应了人工智能可能带来的劳动力市场变化。
  • 与人工智能研究人员和开发人员合作,创建图书馆使用的应用程序,这些应用程序符合伦理和隐私标准,专门满足图书馆和图书馆读者的需求。
  • 充当论坛,交流图书馆人工智能技术伦理使用的最佳实践。

图书馆应在可能和适当的情况下:

  • 帮助他们的读者开发数字文献,包括对人工智能和算法如何工作的理解,以及相应的隐私和伦理问题。
  • 继续集中努力实现终身学习,并在可能的情况下为失业者提供服务。
  • 确保图书馆对人工智能技术的任何使用都应遵守明确的伦理标准,并保障用户的权利。
  • 采购符合法律和伦理隐私及无障碍要求的技术。

附件1:人工智能与知识自由

  • 图书馆中的AI:隐私考虑
  • 图书馆中的AI:偏见、透明度和可解释性

附件2:人工智能素养

人工智能素养可以被概念化为包含以下元素:

  • 对人工智能和机器学习如何工作、其基本逻辑及其局限性的基本理解;
  • 了解人工智能的潜在社会影响,特别是在人权领域;
  • 个人数据管理技能;
  • 媒体和信息素养。

附件3:人工智能 – 处于最前沿的图书馆【较多实例+链接,实际项目链接很可能已失效,但介绍链接通常有效】

  • 第1部分——反思图书馆在人工智能世界中的作用
  • 第2部分——图书馆与人工智能素养
  • 第3部分——图书馆中的人工智能