PCC考虑用Wikibase进行实体管理

合作编目项目(PCC)正考虑使用Wikibase进行实体管理的可能性。相比于任何人都可以更改数据的Wikidata,Wikibase(实例)作为独立维基库,机构可以对其中的数据有更多控制权。

PCC政策委员会于2022年7月14日召开会议,讨论由PCC安装wikibase.cloud实例供PCC成员使用的可能性。由于希望通过Wikibase帮助PCC社区进一步开展工作和实验,目前正在ld4-wikidata邮件组征求意见,对于PCC是否应该这么做,PCC wikibase.cloud实例有哪些用例等。

此前,PCC应用常务委员会(SCA)于2022年6月发布《PCC Wikibase探索报告》(PCC Wikibase Exploration Report),这是2个月前就Wikibase的安装、管理和使用所做的一个问卷调查的结果报告。执行摘要如下:

针对2022年2月PCC参与者会议上提出的关于建立PCC Wikibase实例的建议,PCC主席要求应用常务委员会(SCA)探讨这样做的利弊(包括技术和非技术方面)。SCA于2022年4月对许多拥有Wikibase实例的组织进行了调查,并询问了他们在安装和实施Wikibase实例方面的经验。根据调查结果,SCA建议PCC探索加入Wikibase.cloud的候补名单,这是一个“‘Wikibase即服务’平台,为开放知识项目提供了一种快速轻松地创建Wikibases的新方法”。Wikibase.cloud 不需要安装——这可能有助于减轻对IT安全和基础设施的任何担忧——并且允许创建外部用户帐户和更轻松的管理。

问卷定向发送给已知参与Wikibase工作的10个人,其中6位回复了调查、1位参与者以不同的身份回答了两次,共7份结果。

从报告看,安装使用Wikibase的原因有:管理词表、关联数据存储、关联数据基础设施等。

从结果看,目前大多数Wikibase实例未与机构的现有系统集成,将Wikibase纳入现有工作流程也有不少障碍,另外Wikibase不接受数据批量加载(对有大量现成数据的图书馆是需要应对的问题)。

但结论上,对Wikibase预期用途的总体满意度,有5人表示满意(1-5级中选4)。

问卷调查时Wikibase实例还是本地的WBStack,目前已由云服务Wikibase Cloud取代(任何人都可以查看数据库的内容)。

报告附录1为问卷本身;附录2为问卷回复者提供的附加资料,其中“管理”部分链接到LD4 Wikibase Working Hour WBStack实例,内容为2021年10-12月LD4探索用Wikibase和WBStack如何有助于跟踪LCSH标题的替代标签的使用

PCC身份管理咨询委员会(IMAC)成立

图书馆规范工作的发展方向,是从对象的名称形式选择 (文本字符串)走向实体的身份管理(URI/IRI标识),合作编目计划(PCC)的最新两份战略方向文件(2015-2017 SD3 和 2018-2022 SD4)中体现了这个趋势。PCC的名称规范项目在2016年3月成立身份管理任务组(Task Group on Identity Management in NACO),通过教育、演示、发表的文章、问题识别和这些挑战的解决方案以及探索在不同登记机构工作的可行性的试点来实现这些目标。PCC为实现战略方向中“加速向网络级别的无处不在的标识符创建和身份管理迈进”,反映这一范式转变所涉及的工作和精力的长期性质,以及对身份管理工作的重要关注,2022年6月成立身份管理咨询委员会(IMAC, Identity Management Advisory Committee)。目前正在为这个新成立的委员会寻找成员(截止期2022-8-1),特别鼓励那些目前不是PCC成员或具有ISNI、Wikidata、ORCID或其他注册机构经验的人志愿参加

以下为身份管理咨询委员会职责(摘译自:Identity Management Advisory Committee Charge, 2022-6-9)

PCC 身份管理咨询委员会向PCC政策委员会报告,负责:

  • 1. 就与身份管理相关的一般性和具体问题,以及标识符可以并且正在信息生态圈中扮演的新角色,向 PCC 提供建议。主要关注点将是个人和团体,尽管IMAC可能会在提出要求时就其他类型的实体向PCC提供建议。委员会可以有效地集中精力和注意力的领域包括但不限于
  • a. 铸造(minting)数量足以涵盖图书馆元数据中包含的实体的标识符;
  • b. 可以实际贡献身份管理工作的各种注册机构,以及注册机构之间什么协调程度是可取的;
  • c. 与其他潜在的新伙伴就身份管理工作进行合作的可行性以及可以减少哪些障碍;
  • d. 如何将身份管理最好地集成到图书馆工作流程中,包括从传统的规范控制方法到图书馆元数据中的身份管理方法的迁移路径;
  • e. 现有图书馆创建的标识符可以有效地满足上游(例如出版商工作流程)和下游(例如声誉管理工作、关联数据项目等)需求的方式;
  • f. 需要与培训常设委员会(SCT)合作确定核心培训,以促进这些发展;
  • g. 可以更好地支持身份管理工作的标准的灵活性或修改;
  • h. 识别和倡导支持、管理和评估这项工作所需的工具和应用程序。
  • 2. 协助将身份管理工作融入PCC社区。这可以通过白皮书、与委员会和任务组的专题会议以及根据需要进行的非正式对话来实现。IMAC将作为支持PCC身份管理工作的中央资源,并且与IMAC的协商将在适当的时候写入PCC任务组的职责中。参与身份管理计划的常设委员会和任务组应积极寻求IMAC的参与(而不是要求IMAC将自己插入现有的讨论中)。委员会将:
  • a. 与PCC任务组合作,确保对问题的理解是一致的和互补的,并推荐身份管理的最佳实践;
  • b. 回答政策委员会(PoCo)关于身份管理的问题;
  • c. 向PCC政策委员会建议它可以采取哪些行动来支持合作编目中的身份管理工作;
  • d. 监控一般PCC讨论列表和任何相关的更具体的讨论列表,并酌情回答与身份管理相关的问题;
  • e. 对PCC正在制定的与身份管理相关的报告草稿或工作计划发表评论。
  • 3. 每年,IMAC将在4月15日之前向PCC政策委员会提交工作计划,并在10月15日之前提供书面或口头的活动报告。身份管理咨询委员会将被视为持续存在,直到身份管理问题通常由常设委员会处理。

via [RDA-L] Call for new PCC Identity Management Advisory Committee members / PCC IMAC. 2022-7-21

参见:

LC RDA计划概要与进展(新RDA实施推迟)

2020年12月新RDA工具包更新成为官方版,现在已经过了一年,何时采用仍不明朗。

2022年1月美国国会图书馆发布《LC RDA计划概要与进展》,其中提到PCC(合作编目项目,也即意味着美国主要编目机构)原计划2022年7月后实施,但由于2021年秋季RDA工具包网站更换供应商时网站迁移没有如期完成,导致原定2021年10月的RDA更新推迟到12月、而后又彻底取消,目前定在2022年3月。此一推迟,不但影响RDA本身的更新,也影响到与RDA内容链接的政策声明等相关文档的更新与测试,PCC的实施决定因此将推迟到10月之后。

新RDA由于结构性变化、取消条款号等,实施所必须的政策声明需要完全重新做,工作量巨大。《LC RDA计划概要与进展》介绍了两年多来LC及PCC为实施新RDA所做的工作,包括更新“政策声明(PS)”、新编“元数据指导文档(MGD)”及背后的工具准备与测试等各项任务。文中新旧RDA分别称为official RDA(官方RDA)和original RDA(原RDA)。

更新与RDA相关文档的任务由LC政策、培训和合作计划部(PTCP)承担,由PTCP联合LC及以外人员完成相应任务;PCC由政策委员会(PoCo)负责。文件对我们准备实施RDA有借鉴意义,其中提及完成的政策声明有9千多条,任务艰巨。梳理其时间线及完成任务如下:

LC RDA Project Summary and Update(LC RDA计划概要与进展,2022年1月)

  • 2019年:组建团队。(1)2019年11月LC组建项目团队(PTCP+其他LC编目单位的编目员);(2)[2019年8月]PoCo成立若干测试版RDA任务组(PTCP指派员工共同主持),就新RDA结构的4个实质性编目问题提交报告【4个LC-PCC任务组:元素标签(Element Labels)、历时作品(Diachronic Works)、数据出处(Data Provenance)和合集(Aggregates)】
  • 2019年11月-2020年中:PS内容审查与映射。项目团队审查已有PS并映射到测试版RDA(当时还不是官方版),尝试基于RDA新结构编写新PS,2020年5月前收到任务组报告后,将决定纳入PS。
  • 2020年中-2020年10月:PS批处理工具测试。由于RDA采用DITA发布,2020年年中创建LC PS DITA编辑团队,又与LC ILS专家合作开发批处理程序将PS转换为DITA。2020年12月官方版发布时发布了6000多条LC-PCC PS。
  • 2021年1月- PS正式编写与审核+追踪更新。到3月中完成9000多条PS的审核;DITA团队其批量加载到RDA工具包,与2021年4月第一次官方RDA工具包更新一起发布。另外发布了一个错误报告表,供用户提交所有拼写错误和语法问题。随后对2021年7月RDA工具包更新中更改的条件和选项相关的LC-PCC PS进行编辑。
  • 2021年:新项目“元数据指导文档”(MGD)。MGD充当从原RDA到官方RDA 的“桥梁”文件。MGD已于2022年1月31日完成,3月14日系列文件以PDF形式发布【参见:Official RDA Metadata Guidance Documentation (MGD) Posted,将另写博文】