美国国会图书馆选择folio系统

一早在微信群看到上图刘炜馆长发消息,美国国会图书馆(LC)“已经选择了开源的FOLIO图书馆服务平台作为其下一代的图书馆管理系。正如你们中的许多人已经知道的那样,FOLIO的创新架构允许最大限度的灵活性和可扩展性,这将使该平台能够随着我们需求的变化而增长。图书馆的FOLIO实施将得到EBSCO FOLIO服务的支持。最重要的是,BIBFRAME是一个强制性要求,这意味着对BIBFRAME描述的创建、存储和索引的本地支持。对于BIBFRAME计划来说,这是一个重要的里程碑,也是一个令人兴奋的里程碑!”

消息应该来自LC网络开发与标准办公室主任Sally McCallum在BIBFRAME讨论组的邮件。从邮件链接到LC官网新闻。难得见到新闻稿中3位馆长同时发声,图书馆馆藏管理系统(图书馆服务平台)对图书馆的重要性不言而喻。第一阶段3年,看来LC要真正用上BIBFRAME还需要几年时间,但毕竟终于可以进入实施阶段了。全文翻译如下:

国会图书馆努力改变馆藏管理和访问 Library of Congress Launches Effort to Transform Collections Management and Access (2022-9-21)

国会图书馆已授予一项重要合同,以进一步开发和实施一个新的开源 IT 平台,该平台将彻底改变图书馆庞大的物理和数字馆藏的管理方式,并使公众、国会、本馆员工和其他机构可以访问。

新的图书馆馆藏访问平台软件应用程序将作为本馆馆藏管理运营的核心,将多个独立的 IT 系统连接到一个一站式商店,用于本馆馆藏的采访、描述、典藏和发现。

本馆与马萨诸塞州伊普斯威奇的 EBSCO信息服务公司签订了一份 IDIQ 合同,初始支出为 777 万美元。该平台开发的第一阶段将在三年内耗资 1040 万美元,以满足本馆运营的规模和复杂性,并可选择投资于其他供应商可以开发的额外组件,并且可能会超过三年的时间框架。

EBSCO 将量身定制社区开发的开源图书馆服务解决方案 FOLIO,以提供满足本馆 IT 需求和本馆用户需求的图书馆服务平台。

“这是我们实施以用户为中心的方法以将更多人与本馆馆藏联系起来的旅程中的一个里程碑,”国会图书馆馆长 Carla Hayden 说。“我们感谢国会对这一下一代系统的慷慨投资,这对本馆的数字化前进战略至关重要,该战略利用技术弥合地理鸿沟,扩大我们的范围并增强我们的服务。”

该平台将取代几个遗留的 IT 系统,并为本馆工作人员提供新的、更高效的工具和工作流程,以大规模管理不断增长的物理和数字馆藏。它将为研究人员提供简化的发现体验和访问高质量元数据的新方法。它还将启用BIBFRAME,这是本馆和合作组织正在开发的新书目描述标准,它使用关联数据模型使书目信息在图书馆社区内外更有用。

当该平台全面运行时,它将使用户能够对世界上最大的图书馆的大量馆藏进行全面搜索。该系统将拥有更先进的 IT 安全控制,并将适应不断发展的技术和不断增长的数字内容。

“国会图书馆长期以来一直在为图书馆界开发开放格式和标准方面发挥着关键作用。支持关联开放数据的开源解决方案将不仅为本馆员工和用户带来好处,还为全国其他机构提供支持”,负责发现和保存服务的副馆长 Kate Zwaard (associate librarian) 说。

“图书馆馆藏访问平台的实施是本馆的最高技术优先事项之一” ,图书馆馆藏和服务副馆长 Robin Dale (deputy librarian)说。“这个新系统将使本馆能够跟上技术变革的步伐,并使其能够灵活地容纳本馆管理和提供给用户的数字内容的范围。”

国会图书馆是世界上最大的图书馆,提供现场和在线访问美国的创意记录以及来自世界各地的大量资料。它是美国国会的主要研究机构,也是美国版权局的所在地。探索馆藏、参考服务和其他计划,并计划访问loc.gov在congress.gov访问美国联邦立法信息的官方网站;并在copyright.gov注册作者身份的创意作品。

RDA元数据指导文档(一对一MGD):以正题名为例

与LC-PCC PS配套使用的“元数据指导文档”(Metadata Guidance Documentation, MGD),分为叙述性MGD和一对一MGD两种。参见:

仔细看了上述2个叙述性MGD,接下来再看看一对一MGD。

一对一MGD共有200多个文档,据称映射到500多个新RDA的政策声明,内容与新RDA中的元素(原关系说明语也变为元素)或其特定选项相关联。因此有的一个MGD文档对应一个元素,如载体类型(MG: Manifestation: Carrier type),或是一个元素的特定方面,如政府出版物的制作日期(MG: Manifestation: Date of manufacture: GPO publications);有的则有多个MGD文档对应一个元素的不同方面,可能是不同方面或不同条件下的选项,如生产日期(MG: Manifestation: Date of production)分为3个文档[目前显示4个、有一条重复]:记录(Recording)、在版编目(CIP cataloging)、出版日期不确定(Date of publication not identified)。

一对一MGD包含内容为:

  • 指导(Guidance)
  • MARC示例
  • BIBFRAME示例
  • 参考与附注:即映射,提供原LC-PCC PS编号等(新RDA没有编号)
  • 更新历史

随意找了个最常用的正题名(title proper),正巧除LC/PCC实践外,还有大英图书馆实践。全部内容如下:

正题名:Official RDA Toolkit LC-PCC Metadata Guidance Document: Entities > Manifestation > title proper [PDF, 115 KB; 2页]

  • 指导:记录正题名——不排序字符——LC实践/PCC实践:一般设置MARC字段245的第2个指示符位置(不排序字符)以忽略定冠词和不定冠词,以用于排序和归档目的。但是,不要排除某些冠词:
    • 1、当正题名以冠词起首,该冠词作为个人、家族、地理或团体名称的一部分出现并保留在该名称中;
    • 2、当正题名以冠词起首,并且上下文或编目员判断需要保留它时,例如,这样的题名:
  • MARC示例——
    • 例1:245 00 $a “The” as an introductory element of generic nouns
    • 例2:245 00 $a “El Cid” in literary criticism of the 20th century
  • BIBFRAME示例——不使用不排序指示符
  • 指导:大英图书馆实践:交替题名被视为正题名的一部分。由编目员判断决定是否给交替题名一个检索点。【按传统,LC-PCC也认为交替题名是正题名的一部分,但未提供相应指导】
  • MARC示例——例3
    • 245 14 $a The rail and the rod, or, Tourist-angler’s guide to waters and quarters thirty miles around London
    • 246 13 $a Tourist-angler’s guide to waters and quarters thirty miles around London
  • BIBFRAME示例……(略,上述246内容作为变异题名 bf:VariantTitle 的主题名 bf:mainTitle)
  • 参考与附注:LC-PCC PS 2.3.2.7 【记录正题名,包括:[1]不排序字符;[2]专著丛编/多部分专著:缺少题名或从属题名,见PS2.3.1.7】
  • 更新历史:2022-01-31

RDA工具包去对照看政策声明及元数据指导文档链接:

正题名元素页(Entities > Manifestation > title proper)侧栏政策声明,目前有3家:

  • BLPS(22条):大英图书馆PS只有简单说明:采用、不采用、合适则用、编目员判断等。没有MGD链接。
  • LC-PCC PS(24条):有较详细说明;如有MGD文档、则提供链接。在Prerecording(21.93.72.57)除前述“正题名”一对一MGD外,还链接到“丛编-子丛编”系列MGD(含一个叙述性MGD和数十个一对一MGD)【与原LC-PCC PS对应】
  • MLA BP(24条):音乐图书馆协会最佳实践,再合并LC-PCC PS内容,包括上述MGD链接(方便使用,无需切换MLA和LC-PCC)。

上述一对一MGD仅针对正题名20多条PS中的一条,即预记录(Prerecording),没有涉及任何一个选项。由此可知,MGD是不完全的,针对的是那些需要详细解说指导的内容。即所谓:“当原RDA工具包的LC-PCC PS被评估并映射到官方RDA工具包时,声明的较长部分以及示例被标记为一组单独的官方RDA工具包文档——元数据指导文档( MGD)”。

RDA元数据指导文档(MGD):虚构和真实非人类实体

《IFLA图书馆参考模型》(LRM)规定,虚构的或非真实的实体不属于通常所属的类型。包括:

  • 虚构人物和非真实人类实体不属于“个人”(Person),见LRM-E7的范围注释:“个人实体仅限于有生命或认为有过生命的真实个人”。“一般认为是虚构的(如科米蛙)、文学性的(如简·马普尔小姐)或纯粹传说性质的(如巫师梅林)人物不是实体个人的实例”。
  • 非真实的地点不属于“地点”(Place),见LRM-E10的范围注释:“想象的、传说中的或虚构的地点不是地点实体的实例”。

这些实体被归入最宽泛的类型“资源”(Resource),非人类实体(如动物)也如此。见LRM-E1的范围注释:“资源是明确定义的所有其他实体的超类,以及没有明确标记的任何其他实体的超类”。样例:

  • {Miss Jane Marple} [阿加莎·克里斯蒂(Agatha Christie)多部小说和故事中的人物]
  • {Earthsea} [一个虚拟的世界,厄修拉·K·勒古恩(Ursula K. Le Guin)创作的《地海三部曲》(Earthsea trilogy)的背景]
  • {Pal} [1940年6月4日-1958年6月在世,一只雄性粗毛牧羊犬,1943年至1954年在电影中出演灵犬莱西(有几只帕尔的后代在后来的影视作品中也扮演了灵犬莱西)]

《资源描述与检索》(RDA)遵循LRM,作品的责任只能归于真实的人类或集体行为者。在新RDA的指南部分有“Fictitious and non-human appellations”(虚构和非人类称谓),在载体表现中作为责任说明出现时:对虚构实体,其称谓被假定是行为者、集体行为者、团体、家族或个人的化名称谓[假名、笔名等];对非人类实体,则视为RDA外部的实体。指南介绍了不同条件与选项下使用的RDA元素,但如果落实到MARC记录中会怎么样?

参见:RDA元数据指导文档(MGD):掌握新RDA(2022-9-10)

Official RDA Toolkit LC-PCC Metadata Guidance Document: Fictitious and Real Non-Human Entities [PDF, 233KB, 5页]
RDA元数据指导文档(MGD)的《虚构和真实非人类实体》,提供了LC-PCC的新RDA做法(2022年9月尚未实施),包括MARC和BIBFRAME示例。

  • 简单地说,MARC做法基本照旧

规范记录照旧:“将继续在NAF [名称规范档] 中建立虚构人物和真实的非人类实体的名称规范记录(NAR)”。特别强调提供“实体类型名称”,放在原就有且常用的100$c(头衔和其他相关词):“PCC正在开发用于这些非RDA行为者的实体类型词表”。

书目记录照旧:“根据需要,虚构人物和真实的非人类实体可以在书目记录中创作作品”。

看上去主要变化是:规范和书目记录的040$e(编目来源之描述规则)采用新代码pccrda,而不是rda。“表明这些记录符合PCC对RDA的实施”(换言之,这些是非RDA记录)。本MGD在概述中说,书目记录的描述规则代码未定,但示例中采用了相同新代码。

  • 至于BIBFRAME,似乎完全不涉及这个问题:“将Nomen实例的IRI记录为真实世界对象[RWO]”。换言之,不区分虚构、真实非人类实体,和人类一样,都是RWO。