PCC考虑用Wikibase进行实体管理

合作编目项目(PCC)正考虑使用Wikibase进行实体管理的可能性。相比于任何人都可以更改数据的Wikidata,Wikibase(实例)作为独立维基库,机构可以对其中的数据有更多控制权。

PCC政策委员会于2022年7月14日召开会议,讨论由PCC安装wikibase.cloud实例供PCC成员使用的可能性。由于希望通过Wikibase帮助PCC社区进一步开展工作和实验,目前正在ld4-wikidata邮件组征求意见,对于PCC是否应该这么做,PCC wikibase.cloud实例有哪些用例等。

此前,PCC应用常务委员会(SCA)于2022年6月发布《PCC Wikibase探索报告》(PCC Wikibase Exploration Report),这是2个月前就Wikibase的安装、管理和使用所做的一个问卷调查的结果报告。执行摘要如下:

针对2022年2月PCC参与者会议上提出的关于建立PCC Wikibase实例的建议,PCC主席要求应用常务委员会(SCA)探讨这样做的利弊(包括技术和非技术方面)。SCA于2022年4月对许多拥有Wikibase实例的组织进行了调查,并询问了他们在安装和实施Wikibase实例方面的经验。根据调查结果,SCA建议PCC探索加入Wikibase.cloud的候补名单,这是一个“‘Wikibase即服务’平台,为开放知识项目提供了一种快速轻松地创建Wikibases的新方法”。Wikibase.cloud 不需要安装——这可能有助于减轻对IT安全和基础设施的任何担忧——并且允许创建外部用户帐户和更轻松的管理。

问卷定向发送给已知参与Wikibase工作的10个人,其中6位回复了调查、1位参与者以不同的身份回答了两次,共7份结果。

从报告看,安装使用Wikibase的原因有:管理词表、关联数据存储、关联数据基础设施等。

从结果看,目前大多数Wikibase实例未与机构的现有系统集成,将Wikibase纳入现有工作流程也有不少障碍,另外Wikibase不接受数据批量加载(对有大量现成数据的图书馆是需要应对的问题)。

但结论上,对Wikibase预期用途的总体满意度,有5人表示满意(1-5级中选4)。

问卷调查时Wikibase实例还是本地的WBStack,目前已由云服务Wikibase Cloud取代(任何人都可以查看数据库的内容)。

报告附录1为问卷本身;附录2为问卷回复者提供的附加资料,其中“管理”部分链接到LD4 Wikibase Working Hour WBStack实例,内容为2021年10-12月LD4探索用Wikibase和WBStack如何有助于跟踪LCSH标题的替代标签的使用

PCC身份管理咨询委员会(IMAC)成立

图书馆规范工作的发展方向,是从对象的名称形式选择 (文本字符串)走向实体的身份管理(URI/IRI标识),合作编目计划(PCC)的最新两份战略方向文件(2015-2017 SD3 和 2018-2022 SD4)中体现了这个趋势。PCC的名称规范项目在2016年3月成立身份管理任务组(Task Group on Identity Management in NACO),通过教育、演示、发表的文章、问题识别和这些挑战的解决方案以及探索在不同登记机构工作的可行性的试点来实现这些目标。PCC为实现战略方向中“加速向网络级别的无处不在的标识符创建和身份管理迈进”,反映这一范式转变所涉及的工作和精力的长期性质,以及对身份管理工作的重要关注,2022年6月成立身份管理咨询委员会(IMAC, Identity Management Advisory Committee)。目前正在为这个新成立的委员会寻找成员(截止期2022-8-1),特别鼓励那些目前不是PCC成员或具有ISNI、Wikidata、ORCID或其他注册机构经验的人志愿参加

以下为身份管理咨询委员会职责(摘译自:Identity Management Advisory Committee Charge, 2022-6-9)

PCC 身份管理咨询委员会向PCC政策委员会报告,负责:

  • 1. 就与身份管理相关的一般性和具体问题,以及标识符可以并且正在信息生态圈中扮演的新角色,向 PCC 提供建议。主要关注点将是个人和团体,尽管IMAC可能会在提出要求时就其他类型的实体向PCC提供建议。委员会可以有效地集中精力和注意力的领域包括但不限于
  • a. 铸造(minting)数量足以涵盖图书馆元数据中包含的实体的标识符;
  • b. 可以实际贡献身份管理工作的各种注册机构,以及注册机构之间什么协调程度是可取的;
  • c. 与其他潜在的新伙伴就身份管理工作进行合作的可行性以及可以减少哪些障碍;
  • d. 如何将身份管理最好地集成到图书馆工作流程中,包括从传统的规范控制方法到图书馆元数据中的身份管理方法的迁移路径;
  • e. 现有图书馆创建的标识符可以有效地满足上游(例如出版商工作流程)和下游(例如声誉管理工作、关联数据项目等)需求的方式;
  • f. 需要与培训常设委员会(SCT)合作确定核心培训,以促进这些发展;
  • g. 可以更好地支持身份管理工作的标准的灵活性或修改;
  • h. 识别和倡导支持、管理和评估这项工作所需的工具和应用程序。
  • 2. 协助将身份管理工作融入PCC社区。这可以通过白皮书、与委员会和任务组的专题会议以及根据需要进行的非正式对话来实现。IMAC将作为支持PCC身份管理工作的中央资源,并且与IMAC的协商将在适当的时候写入PCC任务组的职责中。参与身份管理计划的常设委员会和任务组应积极寻求IMAC的参与(而不是要求IMAC将自己插入现有的讨论中)。委员会将:
  • a. 与PCC任务组合作,确保对问题的理解是一致的和互补的,并推荐身份管理的最佳实践;
  • b. 回答政策委员会(PoCo)关于身份管理的问题;
  • c. 向PCC政策委员会建议它可以采取哪些行动来支持合作编目中的身份管理工作;
  • d. 监控一般PCC讨论列表和任何相关的更具体的讨论列表,并酌情回答与身份管理相关的问题;
  • e. 对PCC正在制定的与身份管理相关的报告草稿或工作计划发表评论。
  • 3. 每年,IMAC将在4月15日之前向PCC政策委员会提交工作计划,并在10月15日之前提供书面或口头的活动报告。身份管理咨询委员会将被视为持续存在,直到身份管理问题通常由常设委员会处理。

via [RDA-L] Call for new PCC Identity Management Advisory Committee members / PCC IMAC. 2022-7-21

参见:

从规范控制到身份管理:PCC的工作

偶然看到Cataloging & Classification Quarterly有文章《在全球范围内探索共享身份管理的模型:PCC的NACO身份管理任务组的工作》。因为之前写过《规范控制:从名称选择到实体管理》(数字图书馆论坛2018年第1期第2-7页),对此仍有兴趣。于是第一次通过CALIS外文期刊网的馆际互借、当日达,获取很便捷。文章收到后放了近2个月,今天认真看一遍,结合以前对相关信息的了解,概述PCC在身份管理方面的工作如下。

文章2019年9月投稿,2019年12月在线发布。另:CCQ该期(2020年3/4期)是合作编目计划(PCC)25周年专辑,对国际合作编目、特别是PCC感兴趣的,推荐阅读本辑文章。

Exploring Models for Shared Identity Management at a Global Scale: The Work of the PCC Task Group on Identity Management in NACO / Erin Stalberg … Cataloging & Classification Quarterly, Volume 58, 2020 – Issue 3-4, Pages 428-437. Received 02 Sep 2019, Accepted 27 Nov 2019, Published online: 09 Dec 2019.

导言:在过去的十年中,随着文化遗产社区推动了语义Web就绪标准和技术的发展,图书馆对铸造和链接标识符以创建更好的全球共享实体管理途径越来越感兴趣。在通过国会图书馆和合作编目计划(PCC)的名称规范合作(NACO)进行命名实体的识别和消除歧义时,身份管理活动与传统的图书馆规范控制有很多共通之处。本文专门讨论PCC的NACO身份管理任务组的工作。

PCC《愿景、使命和战略方向 2015-2017》战略方向3:“从主要基于创建文本字符串的方法到侧重于管理身份和实体的方法”【参见:PCC 2015-2017战略规划(2016-6-5)】

《 PCC战略方向 2018-2021》第4项:“ 加速朝着无处不在的网络级创建和身份管理迈进”【参见:PCC 2018-2021战略方向(摘译)(2019-3-24)】

在过去的几年中,PCC探索了各种策略来鼓励图书馆进行身份管理工作:

  • PCC首创行动咨询委员会(PCC Advisory Committee on Initiatives,2011-2014)引入了NACO Lite的概念,该概念旨在降低在现有NACO环境下参与规范工作的障碍【PCC有4个子项目,分别是书目BIBCO、连续出版物CONSER、规范NACO和主题SACO,参与门槛差不多也依此序提高。NACO Lite意在简化程序、扩大规范工作的参与】
  • 2015年,PCC的MARC中URI任务组(PCC Task Group on URIs in MARC)召开会议,以制定管理现有系统中标识符的策略,因为图书馆开始尝试将MARC作为关联数据大规模公开【PCC URIs in MARC Pilot,鼓励在现有MARC记录中增加URI。参见:创制和获取URI的常用词表和参考源指南(2018-3-2);编目常见URI问题:什么时候开始用?RWO又是什么?(2018-3-7)】
  • PCC的NACO身份管理任务组(PCC Task Group on Identity Management in NACO)于2016年负责调查和领导PCC有关将社区从规范控制过渡到身份管理的协调讨论【1、定义了2个关键术语:(1)规范控制:通过规范特定形式的名称或其他术语供访问使用和书目文件维护来管理对实体的访问。规范控制的一个显著特征是它专注于首选的、独特的、人类友好的访问点。(2)身份管理:通过将注册的标识符与指定单个身份或已标识实体的特征数据相关联来进行操作。它的重点是通过使用标识符来区分实体。2、发现9个用例,展示将图书馆规范控制扩展到身份管理空间的机会(隐含:图书馆不参与进去,可能被就此抛弃)】
  • 2017-2018年间,PCC启动了一项试验(PCC ISNI Pilot),测试国际标准名称标识符(ISNI)环境中的身份管理原理:创建、共享和链接标识符,以及创建元数据丰富的生命周期,以实现身份管理活动的分发【2016年在比较ISNI和ORCID后选择与ISNI社区合作。目前合作仍在继续,存在制作同样耗时及费用方面问题】
  • 社区最近开始研究将图书馆数据贡献给Wikidata以及在Wikibase平台中创建标识符的可行性【看到图书馆界通过Wikidata获取获奖音乐家信息及URI的探索,任务组目前正进行Wikidata试验项目:“Wikidata提供了一个平台,该平台可以在协作环境中立即创建关联数据,并且可以自由使用和开放,这与迄今为止探索的其他注册不同”】

结论:使用标识符(而非规范词串)的优点:(1)更具可操作性的元数据,(2)更容易生产,(3)对资源描述中包含实体的更大覆盖,(4)图书馆工作与其他可行合作伙伴的工作保持一致。