从规范控制到身份管理:PCC的工作

偶然看到Cataloging & Classification Quarterly有文章《在全球范围内探索共享身份管理的模型:PCC的NACO身份管理任务组的工作》。因为之前写过《规范控制:从名称选择到实体管理》(数字图书馆论坛2018年第1期第2-7页),对此仍有兴趣。于是第一次通过CALIS外文期刊网的馆际互借、当日达,获取很便捷。文章收到后放了近2个月,今天认真看一遍,结合以前对相关信息的了解,概述PCC在身份管理方面的工作如下。

文章2019年9月投稿,2019年12月在线发布。另:CCQ该期(2020年3/4期)是合作编目计划(PCC)25周年专辑,对国际合作编目、特别是PCC感兴趣的,推荐阅读本辑文章。

Exploring Models for Shared Identity Management at a Global Scale: The Work of the PCC Task Group on Identity Management in NACO / Erin Stalberg … Cataloging & Classification Quarterly, Volume 58, 2020 – Issue 3-4, Pages 428-437. Received 02 Sep 2019, Accepted 27 Nov 2019, Published online: 09 Dec 2019.

导言:在过去的十年中,随着文化遗产社区推动了语义Web就绪标准和技术的发展,图书馆对铸造和链接标识符以创建更好的全球共享实体管理途径越来越感兴趣。在通过国会图书馆和合作编目计划(PCC)的名称规范合作(NACO)进行命名实体的识别和消除歧义时,身份管理活动与传统的图书馆规范控制有很多共通之处。本文专门讨论PCC的NACO身份管理任务组的工作。

PCC《愿景、使命和战略方向 2015-2017》战略方向3:“从主要基于创建文本字符串的方法到侧重于管理身份和实体的方法”【参见:PCC 2015-2017战略规划(2016-6-5)】

《 PCC战略方向 2018-2021》第4项:“ 加速朝着无处不在的网络级创建和身份管理迈进”【参见:PCC 2018-2021战略方向(摘译)(2019-3-24)】

在过去的几年中,PCC探索了各种策略来鼓励图书馆进行身份管理工作:

  • PCC首创行动咨询委员会(PCC Advisory Committee on Initiatives,2011-2014)引入了NACO Lite的概念,该概念旨在降低在现有NACO环境下参与规范工作的障碍【PCC有4个子项目,分别是书目BIBCO、连续出版物CONSER、规范NACO和主题SACO,参与门槛差不多也依此序提高。NACO Lite意在简化程序、扩大规范工作的参与】
  • 2015年,PCC的MARC中URI任务组(PCC Task Group on URIs in MARC)召开会议,以制定管理现有系统中标识符的策略,因为图书馆开始尝试将MARC作为关联数据大规模公开【PCC URIs in MARC Pilot,鼓励在现有MARC记录中增加URI。参见:创制和获取URI的常用词表和参考源指南(2018-3-2);编目常见URI问题:什么时候开始用?RWO又是什么?(2018-3-7)】
  • PCC的NACO身份管理任务组(PCC Task Group on Identity Management in NACO)于2016年负责调查和领导PCC有关将社区从规范控制过渡到身份管理的协调讨论【1、定义了2个关键术语:(1)规范控制:通过规范特定形式的名称或其他术语供访问使用和书目文件维护来管理对实体的访问。规范控制的一个显著特征是它专注于首选的、独特的、人类友好的访问点。(2)身份管理:通过将注册的标识符与指定单个身份或已标识实体的特征数据相关联来进行操作。它的重点是通过使用标识符来区分实体。2、发现9个用例,展示将图书馆规范控制扩展到身份管理空间的机会(隐含:图书馆不参与进去,可能被就此抛弃)】
  • 2017-2018年间,PCC启动了一项试验(PCC ISNI Pilot),测试国际标准名称标识符(ISNI)环境中的身份管理原理:创建、共享和链接标识符,以及创建元数据丰富的生命周期,以实现身份管理活动的分发【2016年在比较ISNI和ORCID后选择与ISNI社区合作。目前合作仍在继续,存在制作同样耗时及费用方面问题】
  • 社区最近开始研究将图书馆数据贡献给Wikidata以及在Wikibase平台中创建标识符的可行性【看到图书馆界通过Wikidata获取获奖音乐家信息及URI的探索,任务组目前正进行Wikidata试验项目:“Wikidata提供了一个平台,该平台可以在协作环境中立即创建关联数据,并且可以自由使用和开放,这与迄今为止探索的其他注册不同”】

结论:使用标识符(而非规范词串)的优点:(1)更具可操作性的元数据,(2)更容易生产,(3)对资源描述中包含实体的更大覆盖,(4)图书馆工作与其他可行合作伙伴的工作保持一致。

美国实施新RDA:不早于2022年7月

测试版RDA工具包已在2020-12-15如期切换为官方版(新RDA)。LC于12-18发布信息,表示其项目团队已完成7500多条的政策声明(LC/PCC-PS)草案【可怕的工作量】。PS目前仍有待审查、修订和测试,将在新RDA发布后首次升级(预计2021-4-5)之后,再接受各方评论。

政策声明只是转换实施新RDA的起点,还需要完成另二种配套文件:1)PCC应用配置文件,2)PCC RDA元数据文档。

10月底PCC政策委员会会议确定,不早于2022年7月实施,会议成果(PoCo 2020 Meeting Outcomes, 2020/10/28-30)涉及新RDA进展部分如下:

  • 决定:PCC实施新RDA的日期不早于2022年7月;LC和PCC将尽可能协调其实施。
  • 行动:PCC主席将向PCC讨论邮件组发送消息,重申在2020年12月15日发布新RDA时,不应在PCC记录中使用新RDA,并宣布预计实施日期不得早于2022年7月;稍后将发送更详细的消息。可能会有一个实施过渡期。
  • 决定:与新RDA有关的LC-PCC文档将统称为“ PCC RDA元数据文档”。
  • 决定:将为MARC和BibFrame描述创建新RDA培训材料。
  • 决定:PCC将在实施前对新RDA进行测试,大概需要2个月。在开始测试之前,应完成PCC RDA元数据文档。
  • 行动:PCC秘书处将讨论可能解除对新的非渠道PCC成员的禁令。【?】

成果中还有3份相关文件链接:

  • LC-PCC政策声明进简述展(Brief update on LC-PCC Policy Statements)
  • 政策委员会讨论:新RDA实施计划( PoCo Discussion: Plans for New RDA Implementation)
  • RDA测试版实施时间表(Timeline for RDA Beta Implementation)


最后这份即《新RDA工具包实施》(Implementation of the New RDA Toolkit, 2020/11/04),有2021/1-2022/6分季度时间表(各种文档准备与测试),2022年7月开始培训编目人员……【实际实施不知何时】

实施准备中有多处提及BIBFRAME,尤其引人注意的是“LC希望使用BIBFRAME编辑器实施RDA,因此不会对员工进行在MARC环境中应用RDA工具包的培训”,可见LC要在转换到BIBFRAME以后再实施新RDA——换言之,BIBFRAME实施已为期不远

看来新RDA要加快BIBFRAME映射工作了(目前各“元素参考”部分仅有LRM和MARC映射)。

欧洲各国实施新RDA计划参见:2020年“RDA在欧洲”虚拟会议:从头开(2020-10-13)

关联数据编目走向现实——新项目LD4P3及LD4社区

梅隆基金资助的“图书馆关联数据”LD4系列项目始于2014年,每2年1-2个项目。2020年中,新项目LD4P3“闭环”得到批准(2020/7/1-2022/6/30,250万美元)。历经多年探索、关联数据编目似乎终于开始进入实际应用阶段。

项目名称“闭环”,指创建一个完整周期的工作模型,以进行图书馆元数据的创建、共享和重用。本项目伙伴(partner)即共同申请者为斯坦福、康奈尔和爱荷华大学图情学院,协作方包括Share-VDE(意大利厂商的托管编目环境)、美国国会图书馆(LC)、合作编目计划(PCC)以及OCLC。此外还有合伙人(cohort),即在LD4P2时已参加从MARC到关联数据编目的PCC成员馆。

主管此项目的斯坦福大学技术与访问服务副馆长Philip Schreur在新闻中称此项目的目的是“使图书馆资源超出图书馆目录的可访问性,并利用来自更广泛网络的相关信息来增强基于图书馆的发现,以及从现有但以前未链接的数据中创建新知识”。

七个主要目标:

  • (1)完成能够与多种环境(例如FOLIO)进行交互的开源关联数据编辑器【对Sinopia的功能要求1】
  • (2)扩大查问规范(QA)范围,以在各种传统(例如LCNAF)和非传统(例如Wikidata、Discogs)规范源中为规范和实体查找以及数据导入提供一流的支持【对QA的要求】
  • (3)通过将QA与OCLC提议的“实体主干”相集成来扩展实体管理【参见:OCLC获梅隆基金资助开发实体管理基础设施(2020-1-11)】
  • (4)以RDF创建所有PCC原始编目的连续馈送池,该池可在世界范围内免费开放使用【PCC数据池】
  • (5)扩大Sinopia与其他数据源(ILS、发现系统、PCC数据池和其他外部数据源)基于API的集成的能力,使RDF环境中的数据流闭环【对Sinopia的功能要求2】
  • (6)将PCC合伙人的管理和培训从LD4P转移到PCC【从项目试验走向实际应用?】
  • (7)可持续发展计划和建模,包括确定单个组件以及LD4P3主要利益相关者在业务、成员资格、服务、软件、数据和运营方面的几种长期选择

七个目标通过五个工作包实现:

  • (WP1)扩大Sinopia环境
  • (WP2)集成并完成生产就绪的关联数据规范支持服务(QA)
  • (WP3)在Blacklight中实现发现增强功能【那个历史悠久的?Blacklight:佛吉尼亚大学的开源OPAC(2008-3-3)】
  • (WP4)通过创建PCC数据池和扩展PCC合伙人来扩展PCC社区的参与
  • (WP5)环境关键部分的可持续性和社区发展

日前LD4社区也宣布成立:ld4.io。“新的LD4社区向任何人开放,供其探索、学习和协作以提高意识和知识,鼓励采用并建立可互操作的标准、工具和服务的生态系统,以将关联开放数据和其他技术从理论付诸实践并规模化。”目前网站汇集LD4年会资料(始于2017)、维基、slack(即时沟通和团队协作)、邮件组(可申请加入发现、Wikidata、非拉丁文字资料3个组)、油管频道、Github等。

  • 社区宪章:LD4是一个共同努力以促进图书馆实践的社区。 我们专注于链接和使用Web上的数据来推进图书馆的使命、宗旨和目标。/ LD4社区的参与对任何人开放——个人或机构、 非营利组织、政府组织或商业组织。通过直接参与,并通过其各种渠道、项目和活动,LD4聚集全球成千上万的个人。
  • 愿景:世界用图书馆数据丰富,图书馆用世界数据丰富。
  • 使命:通过建立一个开放、多样化、可持续和图书馆主导的社区来推进图书馆实践。我们将共同探索、学习和协作,以提高认识和诀窍,鼓励采用,并建立可互操作的标准、工具和服务的生态系统,以便将关联开放数据和其他技术从理论大规模地应用于实践。

参考资料:

LD4系列项目网关 ld4l.org

  • 2014-2016: LD4L (Linked Data for Libraries)
  • 2016-2018: LD4L Labs
  • 2016-2018: LD4P (Linked Data for Production)
  • 2018-2020: LD4P2: Pathway to Implementation
  • 2020-2022: LD4P3: Closing the Loop