开放WEMI(openWEMI)词表发布

WEMI是作品(Work)、内容表达(Expression)、载体表现(Manifestation)和单件(Item)的首字母缩略词,出自1997年《书目记录的功能需求》(FRBR),由2017年《国际图联图书馆参考模型》(IFLA LRM)继承,是书目资源描述领域著名的层次模型。

以曹雪芹的《红楼梦》为例说明之。《红楼梦》本身是作品,120回本和80回本、印刷版和语音版等是不同的内容表达,各出版社《红楼梦》版本是不同的载体表现,一套印刷版《红楼梦》是单件。如此标记的结果是,原本关系不明确的各种《红楼梦》书目记录,相互间有了明确的层级关系,在书目数据呈现时可以进行多样化的聚合,有助于用户选择适合自己需求的版本。

WEMI模型不仅适合于描述图书,对其他非物质文化资源也同样适用。比如罗丹的雕塑《思想者》,有多个不同的翻模版,可视为不同的内容表达,当然它同时也是载体表现和单件,对《思想者》拍摄形成的照片则是不同的内容表达/载体表现,如此等等。openWEMI就是希望把WEMI模型扩展到图书馆领域之外。

2023年末,openWEMI发布草案。参见:开放WEMI(openWEMI)提案发布(2023-12-14) 

近日,正式词表发布:OpenWEMI vocabulary(https://ns.dublincore.org/openwemi/

OpenWEMI由都柏林核心元数据倡议(DCMI)支持,显然目标是如都柏林核心(Dublin Core, DC)一样、成为具有超出图书馆界影响力的通用模型。作为一种元模型,对于没有采用WEMI模型的各种元数据标准,可以使用OpenWEMI为需要描述的资源增加层次关系。

按其介绍:OpenWEMI是一个最小约束词表,用于使用作品、内容表达、载体表现、单件等概念描述创建的资源。

与去年提案相比,正式发布的OpenWEMI是一个很纯粹的WEMI模型,排除了责任实体及其属性,只含资源及其关系:

类5个:超级类Endeavor,4个子类即WEMI

属性15个:包括主要关系、共同关系和相关关系。

相关关系认定很宽松。共同关系则是FRBR没有的,指示两个资源表示或包含相同的 openWEMI 实体。

作为“最小约束词表”,主要关系与FRBR有所不同,不严格要求 W—E—M—I 环环相扣,可以省略中间层,如下图,可以W-E-I或W-M-I等(换言之也可以只分3个层次,因为有的领域很难分出4个层次)。下图出自openWEMI的GitHub主页(https://github.com/dcmi/openwemi,目前还是提案内容,但“主要关系”没有变化):

WEMI主要关系

IFLA命名空间:IFLA标准作为关联数据

在2021-5-27的IFLA元数据在线会议上,Joseph Hafner(IFLA关联数据技术分委员会现任主席(2019-2023)、加拿大麦吉尔大学)介绍:

IFLA命名空间于2020年7月发布

觉得很疑惑,不是多年前就已经发布了吗? 当时就是 iflastandards.info 这个域名。

看IFLA命名空间网站,2020-7-13的新闻就是这样的:IFLA’s Committee on Standards and Linked Data Technical Subcommittee (LIDATEC) are pleased to announce the launch of IFLA Namespaces. https://www.iflastandards.info/

目前列出5个词表,按发布时间排列?MulDiCat似乎早于UNIMARC(附之前写的博文):

关联数据技术分委员会(LIDATEC)前身是2009年成立的命名空间任务组(IFLA Namespaces Task Group),原属IFLA分类与索引部(2016年改为“主题分析与检索部”);2015年改名关联数据技术分委员会、属标准委员会。【参见:IFLA关联技术分委员会公开征求委员(2017-6-12)】

感觉2020年7月发布的应该是LRM词表,之前几个发布时可能没以LIDATEC的名义。

词表注册网站 BARTOC

叙词表、本体和分类法基本注册 BARTOC: Basic Register of Thesauri, Ontologies & Classifications

  • ABOUT
  • BARTOC是知识组织系统(KOS)相关注册表的数据库。
  • BARTOC的主要目标是在一处列出尽可能多的知识组织系统,以实现更高的可见性、突显其功能、使其可搜索和可比较、并促进知识共享。BARTOC包括来自任何主题领域、任何语言、任何发布格式以及任何可访问形式的任何一种KOS。BARTOC的搜索界面支持20种欧洲语言,并提供两种搜索选项:按关键字进行基本搜索和按分类术语进行高级搜索。现已从欧洲各地聚集起一个编辑圈子,并得到国际知识组织学会(ISKO)http://www.isko.org/的认可。
  • BARTOC由Andreas Ledl在瑞士巴塞尔大学图书馆成立,原名:叙词表、本体和分类法的巴塞尔注册。2020年数据库移至德国的Verbundzentrale des GBV(VZG),重命名为BARTOC,并从Drupal移植到新的技术基础架构,该实现完全可以作为开源使用。
  • 更多信息见维基百科:https://en.wikipedia.org/wiki/BARTOC

BARTOC现收录词表3291个,词表注册网站(registry、含资料库repository、服务service)近百个。

  • 收录词表包括以下类型:
  • Gazetteer 地名词典
  • Glossary 词汇表
  • Categorization schema 类别法
  • Classification schema 分类法
  • List 列表
  • Name authority list 名称规范表
  • Ontology 本体
  • Subject heading scheme 主题标目法
  • Semantic network 语义网
  • Synonym ring 同义词环
  • Taxonomy 科学分类
  • Terminology 术语表
  • Thesaurus 叙词表
  • Dictionary 词典
  • BARTOC有3种搜索方法(缺乏自身的术语级搜索):
  • 基本搜索:对词表介绍的全文搜索,按相关性排序
  • 筛选搜索:选择KOS类型、语种、许可、主题及排序方法(主题可选:DDC杜威十进分类法/一级类、EUROVOC欧盟叙词表/大类、ILC综合等级分类/大类)
  • 联合异步搜索工具 BARTOC FAST:访问包含大量词表的23个远程资源,术语级搜索(支持截词和通配府、不支持布尔运算符)