开放WEMI(openWEMI)词表发布

WEMI是作品(Work)、内容表达(Expression)、载体表现(Manifestation)和单件(Item)的首字母缩略词,出自1997年《书目记录的功能需求》(FRBR),由2017年《国际图联图书馆参考模型》(IFLA LRM)继承,是书目资源描述领域著名的层次模型。

以曹雪芹的《红楼梦》为例说明之。《红楼梦》本身是作品,120回本和80回本、印刷版和语音版等是不同的内容表达,各出版社《红楼梦》版本是不同的载体表现,一套印刷版《红楼梦》是单件。如此标记的结果是,原本关系不明确的各种《红楼梦》书目记录,相互间有了明确的层级关系,在书目数据呈现时可以进行多样化的聚合,有助于用户选择适合自己需求的版本。

WEMI模型不仅适合于描述图书,对其他非物质文化资源也同样适用。比如罗丹的雕塑《思想者》,有多个不同的翻模版,可视为不同的内容表达,当然它同时也是载体表现和单件,对《思想者》拍摄形成的照片则是不同的内容表达/载体表现,如此等等。openWEMI就是希望把WEMI模型扩展到图书馆领域之外。

2023年末,openWEMI发布草案。参见:开放WEMI(openWEMI)提案发布(2023-12-14) 

近日,正式词表发布:OpenWEMI vocabulary(https://ns.dublincore.org/openwemi/

OpenWEMI由都柏林核心元数据倡议(DCMI)支持,显然目标是如都柏林核心(Dublin Core, DC)一样、成为具有超出图书馆界影响力的通用模型。作为一种元模型,对于没有采用WEMI模型的各种元数据标准,可以使用OpenWEMI为需要描述的资源增加层次关系。

按其介绍:OpenWEMI是一个最小约束词表,用于使用作品、内容表达、载体表现、单件等概念描述创建的资源。

与去年提案相比,正式发布的OpenWEMI是一个很纯粹的WEMI模型,排除了责任实体及其属性,只含资源及其关系:

类5个:超级类Endeavor,4个子类即WEMI

属性15个:包括主要关系、共同关系和相关关系。

相关关系认定很宽松。共同关系则是FRBR没有的,指示两个资源表示或包含相同的 openWEMI 实体。

作为“最小约束词表”,主要关系与FRBR有所不同,不严格要求 W—E—M—I 环环相扣,可以省略中间层,如下图,可以W-E-I或W-M-I等(换言之也可以只分3个层次,因为有的领域很难分出4个层次)。下图出自openWEMI的GitHub主页(https://github.com/dcmi/openwemi,目前还是提案内容,但“主要关系”没有变化):

WEMI主要关系

开放WEMI(openWEMI)提案发布

都柏林核心(DCMI)上月发布openWEMI接受评审。

openWEMI是一个RDF词表。如名称所示,基于国际图书馆协会联合会(IFLA)1997年《书目记录功能需求》(FRBR)首次引入的“作品、内容表达、载体表现、单件”(WEMI为其首字母缩略)概念。但openWEMI不考虑图书馆目录功能,定义了一组可在各种环境中使用的最小约束的类和属性,期望其他元数据模型能将openWEMI元素用作所定义的更具体资源类型的超类和超属性。【或许能像同样脱胎于图书馆界的都柏林核心(DC)那样,在互联网元数据中得到广泛应用】

相关链接:

openWEMI 词表定义了5个类(《入门》中有6个),其中Endeavor类来自2005年的FRBR Core,是WEMI的上级类【可作为属性的定义域/值域(WEMI中的多个)】,可在省略WEMI中任何一个时宽松使用:

  • Endeavor(一种创作)
    • Work(艺术或智力创作的抽象概念)
    • Expression(一种可感知的创作形式)
    • Manifestation(创作的物理体现)
    • Item(创作的示例)
  • ResponsibleEntity(《入门》:对创作负有一定责任的行为者)

openWEMI 词表定义了16个属性,可分为4组:责任关系、主要关系、共同关系、相关关系

相关关系:可以很宽松地认定。

共同关系:FRBR没有,指示两个资源表示或包含相同的 openWEMI 实体。

主要关系(内在关系),与FRBR不同之处在于,openWEMI不是 W—E—M—I 环环相扣的,可以省略中间层,如下图,可以W-E-I或W-M-I等(出自:openWEMI Primer):

主要关系

《记录分面时间顺序数据最佳实践》(书目记录中作品和内容表达的日期)

ALA核心主题分析委员会(SAC)日前发布《记录分面时间顺序数据最佳实践》(1.0版),本版本在2020年0.9版征求反馈基础上修订完成。竟然长达43页,估计各种情况都可以找到示例。

记录分面时间顺序数据最佳实践(1.0版) / ALA核心主题分析委员会(SAC)分面词表分委员会(SSFV), 2021-6-11. https://alair.ala.org/handle/11213/16710

Best Practices for Recording Faceted Chronological Data in Bibliographic Records (Version 1.0) / Issued by the ALA Core Subject Analysis Committee (SAC), Subcommittee on Faceted Vocabularies (SSFV) ; Approved by SAC on June 11, 2021.  43 pages

本文档描述在书目著录中编码作品和内容表达日期的最佳实践。在MARC书目记录环境中,通过046字段(特殊编码日期)和388字段(创建时间段)实现。文档包括以下4个方面:

  • 1、单作品创建日期(创建日期=出版日期,创建日期<出版日期,大致创建日期,无准确日期时使用388字段)
  • 2、汇编中被汇总作品日期(046字段中特定日期vs不准确日期/含世纪,单个046字段中日期范围vs独立046字段,无准确日期时使用388字段,由记录中其他信息推断日期或大致日期)
  • 3、合集作品(汇编、选集等)创建日期
  • 4、内容表达日期(拍摄/播放日期)

【遵循LRM、合集略有不同理解】本最佳实践遵循《国际图联图书馆参考模型》 (IFLA-LRM) 中对“作品”和“内容表达”的定义。对于合集资源,本最佳实践主要与IFLA-LRM中描述的“汇编合集”子类型有关。 本文档中描述的单作品情况可能符合 IFLA-LRM 中描述的“并列”或“增强”合集;在这种情况下,046和/或388字段中描述的是主要作品。这一重点与MARC书目记录中的其他字段保持一致,这些字段类似地描述了此类资源中包含的主要作品/内容表达。

【目的:增加发现系统的时间分面】书目元数据中分面时间数据的存在,能促进发现环境中的许多潜在用途,本文档不假定任何特定的索引、显示和搜索/分面行为的规范集。事实上,开发增强功能的理由围绕分面数据,通常需要在给定发现环境中的书目记录中存在大量分面数据。希望这些最佳实践指南将通过鼓励在当前编目和回溯性工作中纳入时间数据的分面方法来加速这一临界质量。

以上译自导言。另外,SSFV表示:由于046字段有更新,计划继续修订,推荐使用新的 046字段第1指示符值的方法,以便对作品和内容表达的日期进行明确编码。

【046字段】原用于未能在008/06-14(出版日期)中表示的日期,比如公元前日期、错误日期等,换言之,转录文献显示的出版日期;其代码值与定义与008/06-14相同或对应,只是用子字段表示,方便计算机处理。046字段2021年更新有二,与LRM有关的是第1指示符,增加定义:1=作品,2=内容表达,3=载体表现。

【388字段】以文字/术语表示作品或内容表达的创建或起源时间段。388字段在2014年新增时就定义了第1指示符:1=作品创建,2=合集作品创建。除$a=术语,还定义有:$0=规范记录控制号或标准号,$1=真实世界对象URI,$2=术语来源,等。预设了关联数据环境中的使用。

参见:IFLA-LRM的“合集”(笔记)(2018-7-9)

—— 示例选 ——

【大致创建日期】(1.0版中例子,046第1指示符均为#未定义)

  • 046 ## $k [2015,2016]【=[2017 or 2018]】
  • 046 ## $k 197X【=[between 1970 and 1979?]】
  • 046 ## $k [1973..1984]【=[between 1973 and 1984]】
  • 046 ## $k 18【=19th century】

【无准确日期时使用388字段】(有或没有046字段)

  • 388 1# $a Elizabethan era
  • 388 1# $a Renaissance $2 lcsh【2个相同时代、不同称呼】
  • 388 1# $a American Civil War (1861-1865) $2 fast $0 http://id.worldcat.org/fast/1351658【有URI】

【被汇总内容日期】

  • 046 ## $o 1885 $p 1922 $2 edtf
  • 046 ## $o -05 $p -03【公元前世纪】