美国国会图书馆选择folio系统

一早在微信群看到上图刘炜馆长发消息,美国国会图书馆(LC)“已经选择了开源的FOLIO图书馆服务平台作为其下一代的图书馆管理系。正如你们中的许多人已经知道的那样,FOLIO的创新架构允许最大限度的灵活性和可扩展性,这将使该平台能够随着我们需求的变化而增长。图书馆的FOLIO实施将得到EBSCO FOLIO服务的支持。最重要的是,BIBFRAME是一个强制性要求,这意味着对BIBFRAME描述的创建、存储和索引的本地支持。对于BIBFRAME计划来说,这是一个重要的里程碑,也是一个令人兴奋的里程碑!”

消息应该来自LC网络开发与标准办公室主任Sally McCallum在BIBFRAME讨论组的邮件。从邮件链接到LC官网新闻。难得见到新闻稿中3位馆长同时发声,图书馆馆藏管理系统(图书馆服务平台)对图书馆的重要性不言而喻。第一阶段3年,看来LC要真正用上BIBFRAME还需要几年时间,但毕竟终于可以进入实施阶段了。全文翻译如下:

国会图书馆努力改变馆藏管理和访问 Library of Congress Launches Effort to Transform Collections Management and Access (2022-9-21)

国会图书馆已授予一项重要合同,以进一步开发和实施一个新的开源 IT 平台,该平台将彻底改变图书馆庞大的物理和数字馆藏的管理方式,并使公众、国会、本馆员工和其他机构可以访问。

新的图书馆馆藏访问平台软件应用程序将作为本馆馆藏管理运营的核心,将多个独立的 IT 系统连接到一个一站式商店,用于本馆馆藏的采访、描述、典藏和发现。

本馆与马萨诸塞州伊普斯威奇的 EBSCO信息服务公司签订了一份 IDIQ 合同,初始支出为 777 万美元。该平台开发的第一阶段将在三年内耗资 1040 万美元,以满足本馆运营的规模和复杂性,并可选择投资于其他供应商可以开发的额外组件,并且可能会超过三年的时间框架。

EBSCO 将量身定制社区开发的开源图书馆服务解决方案 FOLIO,以提供满足本馆 IT 需求和本馆用户需求的图书馆服务平台。

“这是我们实施以用户为中心的方法以将更多人与本馆馆藏联系起来的旅程中的一个里程碑,”国会图书馆馆长 Carla Hayden 说。“我们感谢国会对这一下一代系统的慷慨投资,这对本馆的数字化前进战略至关重要,该战略利用技术弥合地理鸿沟,扩大我们的范围并增强我们的服务。”

该平台将取代几个遗留的 IT 系统,并为本馆工作人员提供新的、更高效的工具和工作流程,以大规模管理不断增长的物理和数字馆藏。它将为研究人员提供简化的发现体验和访问高质量元数据的新方法。它还将启用BIBFRAME,这是本馆和合作组织正在开发的新书目描述标准,它使用关联数据模型使书目信息在图书馆社区内外更有用。

当该平台全面运行时,它将使用户能够对世界上最大的图书馆的大量馆藏进行全面搜索。该系统将拥有更先进的 IT 安全控制,并将适应不断发展的技术和不断增长的数字内容。

“国会图书馆长期以来一直在为图书馆界开发开放格式和标准方面发挥着关键作用。支持关联开放数据的开源解决方案将不仅为本馆员工和用户带来好处,还为全国其他机构提供支持”,负责发现和保存服务的副馆长 Kate Zwaard (associate librarian) 说。

“图书馆馆藏访问平台的实施是本馆的最高技术优先事项之一” ,图书馆馆藏和服务副馆长 Robin Dale (deputy librarian)说。“这个新系统将使本馆能够跟上技术变革的步伐,并使其能够灵活地容纳本馆管理和提供给用户的数字内容的范围。”

国会图书馆是世界上最大的图书馆,提供现场和在线访问美国的创意记录以及来自世界各地的大量资料。它是美国国会的主要研究机构,也是美国版权局的所在地。探索馆藏、参考服务和其他计划,并计划访问loc.gov在congress.gov访问美国联邦立法信息的官方网站;并在copyright.gov注册作者身份的创意作品。

RDA元数据指导文档(一对一MGD):以正题名为例

与LC-PCC PS配套使用的“元数据指导文档”(Metadata Guidance Documentation, MGD),分为叙述性MGD和一对一MGD两种。参见:

仔细看了上述2个叙述性MGD,接下来再看看一对一MGD。

一对一MGD共有200多个文档,据称映射到500多个新RDA的政策声明,内容与新RDA中的元素(原关系说明语也变为元素)或其特定选项相关联。因此有的一个MGD文档对应一个元素,如载体类型(MG: Manifestation: Carrier type),或是一个元素的特定方面,如政府出版物的制作日期(MG: Manifestation: Date of manufacture: GPO publications);有的则有多个MGD文档对应一个元素的不同方面,可能是不同方面或不同条件下的选项,如生产日期(MG: Manifestation: Date of production)分为3个文档[目前显示4个、有一条重复]:记录(Recording)、在版编目(CIP cataloging)、出版日期不确定(Date of publication not identified)。

一对一MGD包含内容为:

  • 指导(Guidance)
  • MARC示例
  • BIBFRAME示例
  • 参考与附注:即映射,提供原LC-PCC PS编号等(新RDA没有编号)
  • 更新历史

随意找了个最常用的正题名(title proper),正巧除LC/PCC实践外,还有大英图书馆实践。全部内容如下:

正题名:Official RDA Toolkit LC-PCC Metadata Guidance Document: Entities > Manifestation > title proper [PDF, 115 KB; 2页]

  • 指导:记录正题名——不排序字符——LC实践/PCC实践:一般设置MARC字段245的第2个指示符位置(不排序字符)以忽略定冠词和不定冠词,以用于排序和归档目的。但是,不要排除某些冠词:
    • 1、当正题名以冠词起首,该冠词作为个人、家族、地理或团体名称的一部分出现并保留在该名称中;
    • 2、当正题名以冠词起首,并且上下文或编目员判断需要保留它时,例如,这样的题名:
  • MARC示例——
    • 例1:245 00 $a “The” as an introductory element of generic nouns
    • 例2:245 00 $a “El Cid” in literary criticism of the 20th century
  • BIBFRAME示例——不使用不排序指示符
  • 指导:大英图书馆实践:交替题名被视为正题名的一部分。由编目员判断决定是否给交替题名一个检索点。【按传统,LC-PCC也认为交替题名是正题名的一部分,但未提供相应指导】
  • MARC示例——例3
    • 245 14 $a The rail and the rod, or, Tourist-angler’s guide to waters and quarters thirty miles around London
    • 246 13 $a Tourist-angler’s guide to waters and quarters thirty miles around London
  • BIBFRAME示例……(略,上述246内容作为变异题名 bf:VariantTitle 的主题名 bf:mainTitle)
  • 参考与附注:LC-PCC PS 2.3.2.7 【记录正题名,包括:[1]不排序字符;[2]专著丛编/多部分专著:缺少题名或从属题名,见PS2.3.1.7】
  • 更新历史:2022-01-31

RDA工具包去对照看政策声明及元数据指导文档链接:

正题名元素页(Entities > Manifestation > title proper)侧栏政策声明,目前有3家:

  • BLPS(22条):大英图书馆PS只有简单说明:采用、不采用、合适则用、编目员判断等。没有MGD链接。
  • LC-PCC PS(24条):有较详细说明;如有MGD文档、则提供链接。在Prerecording(21.93.72.57)除前述“正题名”一对一MGD外,还链接到“丛编-子丛编”系列MGD(含一个叙述性MGD和数十个一对一MGD)【与原LC-PCC PS对应】
  • MLA BP(24条):音乐图书馆协会最佳实践,再合并LC-PCC PS内容,包括上述MGD链接(方便使用,无需切换MLA和LC-PCC)。

上述一对一MGD仅针对正题名20多条PS中的一条,即预记录(Prerecording),没有涉及任何一个选项。由此可知,MGD是不完全的,针对的是那些需要详细解说指导的内容。即所谓:“当原RDA工具包的LC-PCC PS被评估并映射到官方RDA工具包时,声明的较长部分以及示例被标记为一组单独的官方RDA工具包文档——元数据指导文档( MGD)”。

RDA元数据指导文档(MGD):合集

《IFLA图书馆参考模型》(LRM)引入“合集”模型(5.7 Modelling of Aggregates ),“合集定义为具体化多个内容表达的载体表现”。合集分3类:汇编(Collection Aggregate)、增加/增强(Augmentation Aggregate)、并列(Parallel Aggregate)。大致可以认为,合集对应于合订汇编,归于载体表现。

《资源描述与检索》(RDA)遵循LRM,在新RDA的指南部分有“Aggregates”(合集),对合集载体表现集合内容表达集合作品如何描述合集作出规定。

参见:(不同术语:集合作品/被集合作品|内容表达 vs 汇总/被汇总作品|内容表达)

RDA元数据指导文档(MGD)《合集》提供LC-PCC的相关指导,针对为具体化在合集中的内容表达提供检索和描述,即针对揭示载体表现中的内容表达,涉及检索点和相关附注。MARC示例提供字段内容及解说,BIBFRAME示例只提供属性及一般说明。

参见:RDA元数据指导文档(MGD):掌握新RDA(2022-9-10)

Official RDA Toolkit LC-PCC Metadata Guidance Document: Aggregates [PDF, 410 KB; 34页]
文档很长,几点笔记,示例仅提及MARC:

  • 合集是具体化多个内容表达的载体表现。所有合集都具体化两种类型的内容表达
    • 1、被集合内容表达,代表合集的内容。一个合集包含多个此类内容表达。
    • 2、集合内容表达。它是集合作品的内容表达。这是合集的计划,包括选择了哪些内容以及如何在合集中对其进行排序。计划不是内容本身,一个合集只包含一个此类内容表达。
  • 原始RDA允许在合集模型和整体/部分模型中选择。LC-PCC选择了整体/部分模型,对于作品的汇编,汇编中的个别作品与整体作品具有整体/部分关系。由于LRM采用合集模型,新RDA也遵循。“虽然这是一种新的思维方式,但除了使用新关系,结果应该看起来或多或少与使用原RDA生成的数据相同。”
  • 图书馆收藏的大多数资源都是合集。会议录、文集之类自不必说,含序言、插图、书目、索引的专著也被视为合集。
  • 序言、插图、书目、索引等专著常见成份视为增强内容,因此增强合集范围极广。增强内容有两种表达方式,即直接识别(提供分析检索点)或做附注(内容/目次附注、书目索引附注等)。对应的RDA元素可能有所变化,但MARC记录与原有做法没什么差别,只是需要用新的概念去理解。
  • 对合集中不同内容有不同处理方法,“没有必要或不希望提供对合集中所有内容表达的检索或描述”(比如序言就常被忽略)。
  • 合集外延很大,有的载体表现具有不止一种合集的特征(比如有序言的双语对照诗集)。要求“按以下顺序应用本文档中的指南:汇编合集、并列合集、增强合集”。
  • 汇编合集所用MARC字段示例:
    • 1、检索集合内容表达:100+240;
    • 2、检索内容(被集合内容表达):第1个或主要被集合内容,分析 700$i Expression manifested: 或505基本内容附注(其他由编目员判断);
    • 3、与其他描述关系(链接款目,各被集合内容表达有对应独立载体表现/单独记录[如合订本]):774 08 $iPart manifestation: $w
  • 并列合集所用MARC字段示例:
    • 1、不要创建受控检索点来表示并列合集的集合内容表达【不做130/240统一题名】;
    • 2、提供原始语言内容表达、首个翻译的直接检索,其他编目员判断。内容检索:分析 700/730$i Expression manifested:
  • 增强合集所用MARC字段示例:
    • 1、检索主要内容:100+245或130;
    • 2、检索增强内容:分析 730$i Expression manifested: 或505增强内容附注;
    • 3、描述增强内容:通用附注500或专用附注504、300$b插图等。
  • 正式内容附注:在505字段目次中提供的信息,如通常只记录正题名和首个第一责任说明,如果个别卷没有题名则记为 [without special title],以及编号、标点等各种细节,用到时可细查。
    • 另有LC针对e-CIP是否做内容附注的效率与收益考量。
  • 分析编目(通常不做):为被集合内容表达(即部分内容)做记录,关联被集合内容表达的描述到合集载体表现:773 08 $i Part of manifestation: $w;关联到集合内容表达:700 1# $i Aggregated by:
  • 丛编-子丛编:LC早些年已放弃维护丛编规范。
    • 通常不做丛编记录,如果做:
      • 1、子丛编(作品)关联到其主丛编(作品):760$i Subseries of: ;
      • 2、主丛编(作品)关联到其子丛编(作品):762$i Subseries: ;
      • 3、不做卷期载体表现记录、但希望提供期的检索:丛编记录中分析 730$i Issue:。
    • 通常载体表现中做丛编某卷期:490/830(二者不一致时)[不用700/730$i Issue of:]