《IFLA标准通讯》创刊

2023年3月,IFLA标准咨询委员会主办《IFLA标准通讯》第1卷第1期发布:

Subscribe now to the new IFLA Standards Newsletter (2023-3-30)

《IFLA标准通讯》创刊号于2023年3月出版。这份新的通讯为IFLA标准和指南及其国际同行提供了一个新闻、信息和讨论的国际论坛。其目的是展示IFLA专业单位制定和维护的广泛标准,使图书馆能够评估和调整其在图书馆工作各个方面的运营和绩效。在标准的国际范围内,它还试图强调国家和国际同行机构和标准化组织在图书馆和信息标准方面的工作。

邮件订阅:https://ifla.us8.list-manage.com/subscribe?u=0662c37e26c91dcab4797c0e2&id=9db44b5dd7

IFLA Standards Newsletter, Volume 1, Issue 1, March 2023

在创刊号上,标准咨询委员会(CoS)主席的欢迎词表明,CoS通讯工作组此项工作是在中断数年后启动的。

编辑团队的欢迎词称今年计划出两期(意指未定常规发行周期),固定栏目有:1篇与两位专家的访谈,1篇主题文章,1个IFLA标准或指南简介,专题文章和近期批准标准的进展。

创刊号内容

  • 专家访谈:ISSN国际中心主任Gaëlle Béquet和波尔多蒙田大学图书馆和档案馆主任Gregory MiuraUNIMARC常设委员会(PUC)进展
  • IFLA命名空间(2020年7月推出)【参见:IFLA命名空间:IFLA标准作为关联数据(2021-5-31)】
  • LRMoo,面向对象框架中的高层模型(LRMoo模型通过提供面向对象的模型版本,将《IFLA图书馆参考模型》(IFLA LRM)纳入CIDOC概念参考模型(CRM)系列模型,该模型被设计为CIDOC CRM的扩展。这有助于图书馆和博物馆信息系统在更广泛的遗产部门之间的互操作性。)[由FRBRoo更新,评审至2023-3-31]
  • IFLAPARL《议会图书馆指南》(第3版,2022-7出版)
  • ISBD:标准配置文件(详细回顾)【参见:ISBD:2011统一版之2021更新(草案)(2022-5-16)】
  • ISNI数据库中出版商的识别和描述:正在进行的工作(2016年,OCLC召集工作组起草了题为《用组织标识符和ISNI应对挑战》的报告。出版商数据模式工作组由ISNI图书馆部门指导小组于2022年5月成立)
  • ISBD:一个标准,两个修订版【参见:ISBD修订:基于LRM的《载体表现ISBD》(ISBDM)(2022-10-6)】
  • 2022年标准咨询委员会批准的新标准(2月《ISBD国际标准书目描述:2021 2011年统一版更新》,7月第3版《议会图书馆指南》,6月《数字时代国家书目通用做法》【参见:IFLA《数字时代国家书目通用做法》发布(2022-8-29)】,7月《IFLA专业LIS教育项目指南》【参见:《IFLA专业图书馆与信息科学教育项目指南》发布(2022-7-27)】
  • 征稿

附:IFLA 标准进展(Standards work in progress

  • 标准进展:评审中标准,结束评审标准,开发中标准
  • 最近完成并发布标准(2015年以来的标准清单),链接到现行标准网页
  • IFLA 现行标准(Current IFLA Standards

PCC 2023-2027战略方向

PCC Strategic Directions, 2023-2027 (March 9, 2023)

《PCC战略方向,2023-2017》最新发布。前几次可参见:

没有和前几次的战略规划/战略方向细致对照,仅就感觉粗略查了下,以下几点或可视为新动向:

1、多样、公平和包容(diversity, equity and inclusion,简称DEI),这是美国近年最重要的“政治正确”。除在使命(Mission)中提DEI外,专设SD6,与残障友好的“可及”合并称ADEI(Accessibility, Diversity, Equity and Inclusion),并说明其他SD也体现ADEI原则。

  • 在编目(元数据)领域,主题词表特别容易有这方面的问题。6.5专述此方面行动,术语“批评编目”(critical cataloging)“修复编目/描述”(reparative cataloging/description)

2、技术多元化(pluralism)。前些年强调关联数据、目标是替换现有元数据实践,现在则强调技术多元、即新旧并存,认可MARC有相当长的过渡期。当然,关联数据的发展方向并未改变。

  • 5个行动:2.1映射;2.2身份/实体管理,URI、协调服务(reconciliation services);2.3 RDA,政策声明、元数据指导文件等;2.4更多词表;2.5 MARC改进:主动废止重复和/或未充分利用的元数据编码做法(例如,在MARC记录的其他地方重复信息的固定字段);在废止不可行时,鼓励开发元数据编辑工具,最大限度地减少重复的人工数据输入。

3、Share-VDE(虚拟发现环境),Share Catalog进化而来的联机目录,应用BIBFRAME。转换到关联数据/BIBFRAME之后,PCC需要联合目录库,这就是PCC数据池,采用Share-VDE。相关博文:https://catwizard.net/page/6?s=share+vde

4、编目减员严重,希望招募(图书馆外的)元数据从业者和LIS研究生参与PCC项目。

此外,由文件可见PCC的各种委员会,6个战略方向(SD)有各自的具体行动(Actions),分别由一个或多个委员会承担:

  • 政策委员会 PoCo(Policy Committee)
  • 标准常设委员会 SCS(Standing Committee on Standards)
  • 应用常设委员会 SCA(Standing Committee on Applications)
  • 培训常设委员会 SCT(Standing Committee on Training)
  • 关联数据咨询委员会 LDAC(Linked Data Advisory Committee)
  • 身份管理咨询委员会 IMAC(Identity Management Advisory Committee)
  • 多样公平包容咨询委员会 DEIAC(Diversity, Equity and Inclusion Advisory Committee)

—— PCC 2023-2027战略方向 ——

以下为6个SD(战略方向),省略其下具体行动(Actions)。

  • SD1:与更广泛的元数据利益相关者社区接触

随着PCC在其历史上面向内部和MARC 21的重点之外采取进一步措施,它必须在一致的基础上与更广泛的社区接触。近年来,它已经开始与ISNI(国际标准名称标识符)、Share-VDE(共享虚拟发现环境)和其他社区建立合作伙伴关系,并尝试和试行超越历史MARC限制的重新构想的元数据实践。在接下来的几年里,PCC必须加强努力,与符合其目标的其他组织合作。这包括GLAM(画廊、图书馆、档案馆和博物馆)元数据社区,以及非GLAM和供应商社区。此外,用户体验(UX)因素必须成为图书馆元数据规范未来发展的驱动因素。PCC必须采取积极主动的措施,打破功能竖井/谷仓,更直接地满足我们所描述的资源用户的发现需求。

  • SD2:促进技术多元化和持续相关性的文化【关联数据与MARC并存】

近年来,图书馆元数据实践开始多样化,一些机构采用关联数据技术,而另一些机构在可预见的未来将在很大程度上保留基于MARC的工作流程。并非所有机构都能或希望在这一过渡期以同样的速度接受新技术,但PCC必须欢迎新兴实践的早期采用者和既定实践的维护者的参与并支持他们的需求。在这个技术多元化和人们对关联数据原则越来越感兴趣的时代,元数据的可共享性至关重要。PCC应在未来几年集中精力促进元数据的互操作性,并继续淡化虚幻的“完美”书目或规范记录的化妆品方面。一个相关的、可持续的合作项目是指我们的集体智力和增值工作得到尽可能有效和可扩展的利用。

  • SD3:增强合作项目的活力【招募(图书馆外的)元数据从业者和LIS研究生参与PCC项目】

随着编目/元数据部门因退休和自然减员而持续缩减,(当前和未来)PCC参与者的人才库受到负面影响。PCC有着通过其漏斗计划邀请更广泛的贡献者参与的既定记录,与正式机构成员相比,漏斗计划已经通过降低生产要求降低了进入门槛。也就是说,由于元数据工作的性质正在演变,PCC仅根据MARC记录统计来衡量贡献已经没有意义了。此外,PCC应该加倍努力,招募更大、更多元化的人才库,他们不仅能够通过元数据制作做出贡献,而且也可以在PCC的组织结构中任职。通过这样做,PCC将有助于培养未来几代的领导者。

  • SD4:变换PCC形像

PCC在编目和元数据专业知识以及高质量MARC元数据的生产方面建立了坚实的声誉。然而,其许多最活跃的成员来自少数(大多规模较大、人员配备充足、资金充足)机构。因此,来自较小和/或更专业机构的同事,以及来自美国、加拿大和英国以外机构的同事可能认为自己没有体现在PCC的目标中。此外,如上文SD2所述,近年来,图书馆元数据实践已开始多样化,一些机构采用关联数据技术,而另一些机构在可预见的未来将在很大程度上保留基于MARC的工作流程。PCC必须被视为一个“大帐篷”,在这里,专业知识、可培训性和为集体利益工作的意愿比机构“血统”更重要,是成为成员和领导的先决条件。PCC本身的关注点不断扩大,也为重塑其形象和品牌提供了机会。它的四个组成项目植根于MARC记录制作,但PCC的工作不再局限于这些核心活动。现在是PCC重新考虑如何在更广阔的世界中最好地代表自己的时候了。

  • SD5:评估和改进PCC存储和共享知识的方式【文档保存,版本控制、档案价值;推广使用,不同访问方式;交互式学习+自我评估+寻求帮助】

PCC拥有强大的集体智慧和记忆力,在考虑未来的政策和优先事项时,它经常被要求利用这些智慧和记忆力。保存和管理这些丰富的知识有时很难。PCC网站(由国会图书馆PCC秘书处维护)最近补充了一个(可协作编辑)wiki,可用于组织更短暂的知识。为了优化这一环境,现在需要进行有意的全面评估。其次,PCC的集体记忆主要保存在Word和PDF文档中。由于该信息的索引和组织不一致,因此该信息的存档价值存在漏洞。展望未来,PCC应探索多种方法,不仅为了子孙后代的利益,保留其关于图书馆元数据实践的长期知识,而且为多元文化和多语言受众有效地打包当前内容。随着元数据实践本身的不断多样化,围绕这些实践传递技能和知识的方法也必须多样化,以跟上当今的可访问性和可用性规范。

  • SD6:通过可及、多样、公平和包容(ADEI)原则来评估和改进PCC的运作【新成立DEI咨询委员会】

作为其上一个战略计划的一部分,PCC委托成立了一个新的多样公平包容咨询委员会(DEIAC)。该小组已经在PCC运营的所有领域推进ADEI理想方面取得了重大进展。随着该小组的成熟和继续开展工作,PCC将出现一种新的文化和运营模式。必须不断评估和更新这一范式,以跟上全球ADEI工作的快速发展。因此,这一战略方向是对先前工作的延续和加强,而不是一个全新的领域。本文件中描述的其他战略方向也包括适用的ADEI原则。

国际标准内容代码(ISCC)

国际标准内容代码(ISCC),是针对数字内容(媒体文件和网页以及其部分)的细粒度的唯一标识符。任何人都可不经许可、免费为属于或不属于自己的数字内容创建ISCC。

作为新的ISO标准草案,ISCC于2021年10月立项,目前正在审查与征求意见阶段(30.20):

ISO/CD 24138.2 Information and documentation — International Standard Content Code

本文件规定了国际标准内容代码(ISCC)的语法和结构,作为数字资产的识别系统(包括全媒体领域的文本、图像、音频、视频或其他内容的编码)。它还描述了ISCC元数据以及ISCC与其他方案(如ISO/TC 46/SC 9定义的方案)的结合使用。ISCC适用于特定的数字资产,是使用本文档中的算法和规则从多个散列构建的数据描述符。组织、个人和机器可以为多种数字资产生成ISCC,并将其用于识别和管理这些资产。ISCC的生成或使用本身不会对所标识内容的作者或所有权作出任何声明或声明。

ISCC网站(https://iscc.codes/)有详细资料。“本文档的第一个版本来自内容区块链项目的原型项目,并获得了谷歌数字新闻计划(DNI)的资助”。

与以往那些“标准号”由权威机构赋予不同,ISCC不必手动分配,是根据数字内容本身、由公开的算法计算生成,是去中心化、免费、开源和透明的。ISCC标识符甚至可以离线生成,也不要求注册中心。

很自然会有疑问:如何经由ISCC标识符,到达数字内容?数字内容(如网页)有变化,怎么知道对应的版本?“当ISCC代码需要全球唯一、可公开发现、可解析、拥有或认证时,就需要进行ISCC注册”。ISCC专为基于区块链的注册而设计,任何人都可以做自己的注册中心。

ISCC代码为复合标识符,由4段代码组成:

  • 元代码 Meta-ID
  • 内容代码 Conten-ID
  • 数据代码 Data-ID
  • 实例代码 Instance-ID

每段13字符,共52字符;也可用-分隔,共55字符。前置ISCC作为标识。各段代码均以C起始,前2位含意:元代码CC内容代码:文本CT(其他媒体类型略),数据代码CD实例代码CR。如:

ISCC: CCDhJSBP6E1Gy-CTj6HAYRavnph-CD2Sd11rt7yLE-CRj3tVexKA1YX

上述4段设计的基点是,ISCC认为数字媒体识别从抽象到具体有6层,分别是:

  • 第1层抽象创作(Abstract Creation)【Creation可比拟FRBR/LRM的“作品”,对应第1段“元代码”。以元数据作为代表,实际生成时基本上只取题名,不用创作者、理由是具有一致性,不考虑Meta-ID的唯一性】
  • 第2层语义场(Semantic Field)【作品的主题,ISCC代码不采用】
  • 第3层–通用表现形式(Generic Manifestation)【Manifestation可比拟FRBR/LRM的“内容表达”,对应第2段“内容代码”。称“将一组不同的版本与同一内容的更正、修订、编辑、更新、个性化、不同格式编码或数据压缩捆绑在一个分组标识符下”,“这样的过程预计不会产生总是符合人类对边界确切位置的期望的直观结果”。以为类似编目中实体边界问题,看举例似乎只是相同内容的不同格式文件,如 PDF、MS-word 或 EPUB 文件,或 JPEG 和 PNG 文件等,有相同的Content-ID】
  • 第4层–媒体特定表现形式(Media Specific Manifestation)【对应第3段“数据代码”】
  • 第5层精确表示(Exact Representation)【Representation可比拟FRBR/LRM的“载体表现”,对应第4段“实例代码”】
  • 第6层-单独副本#(Individual Copy)【Copy可比拟FRBR/LRM的“单件”。ISCC代码不采用,讨论到“虽然物理对象永远只能有一个完全相同的单独副本,但数字对象的“单独副本”总是可以有无穷无尽的复制品”】

试用ISCC

ISCC有代码生成的演示网站(https://iscc.coblo.net/),试着为自己的博客、博文生成ISCC。

  • 博客网站https://catwizard.net首次生成ISCC,元数据Title识别为:编目精灵iii 曾经的编目员继续网络闲游(2023-03-04 15:49:12)
  • CCDhJSBP6E1Gy – CTAAyUJ5WiJYC – CDvBVRRxEEdWz – CRvzPL74HRnsN
  • 数天后有博文更新,再次生成,Meta-ID未变,其余3个ID变化(2023-03-13 10:44:49)
  • CCDhJSBP6E1Gy – CTj6HAYRavnph – CD2Sd11rt7yLE – CRj3tVexKA1YX
  • 为单篇博文“探访巩义北宋八陵”(/posts/2023/0312/6051)生成JSCC,元数据Title识别为:编目精灵iii。4段ID均变化(2023-03-14 10:05:33)
  • CCgMkXL4KMfe9 – CThibYsrhRMVF – CDvYjVDMSxuPv – CRMLDE33fc6pF
  • 相同博文的微信版(https://mp.weixin.qq.com/s/4mP126l2lDRYmOyhhxChrA),元数据Title识别为:探访巩义北宋八陵。文字基本相同,但增加了很多图片,4段ID无一相同或相近,说好的可以“帮助识别剽窃”?(2023-03-13 11:17:01)
  • CCbzDNxrtF8AA – CT9eAjcLmYRv5 – CDH7ZSWNDq9h6 – CR2ecyY451pKL
  • 最奇怪的是,次日为微信版再次生成ISCC,后2段居然变了(2023-03-14 10:10:48)
  • CCbzDNxrtF8AA – CT9eAjcLmYRv5 – CDvHX8Heqa6Nv – CRFmRmnEb3cHd
  • 本文写到最后,再生成一次,又变了(2023-03-14 16:16:15)
  • CCbzDNxrtF8AA – CT9eAjcLmYRv5 – CDvmC3T1BSSSn – CRZzctSKT9PJE

博文的没变,看来只是与微信有关,或许微信会不时改变网页(图文显示不变)。对内容,是不是只看ISCC的第2段代码就可以了?