开放WEMI(openWEMI)词表发布

WEMI是作品(Work)、内容表达(Expression)、载体表现(Manifestation)和单件(Item)的首字母缩略词,出自1997年《书目记录的功能需求》(FRBR),由2017年《国际图联图书馆参考模型》(IFLA LRM)继承,是书目资源描述领域著名的层次模型。

以曹雪芹的《红楼梦》为例说明之。《红楼梦》本身是作品,120回本和80回本、印刷版和语音版等是不同的内容表达,各出版社《红楼梦》版本是不同的载体表现,一套印刷版《红楼梦》是单件。如此标记的结果是,原本关系不明确的各种《红楼梦》书目记录,相互间有了明确的层级关系,在书目数据呈现时可以进行多样化的聚合,有助于用户选择适合自己需求的版本。

WEMI模型不仅适合于描述图书,对其他非物质文化资源也同样适用。比如罗丹的雕塑《思想者》,有多个不同的翻模版,可视为不同的内容表达,当然它同时也是载体表现和单件,对《思想者》拍摄形成的照片则是不同的内容表达/载体表现,如此等等。openWEMI就是希望把WEMI模型扩展到图书馆领域之外。

2023年末,openWEMI发布草案。参见:开放WEMI(openWEMI)提案发布(2023-12-14) 

近日,正式词表发布:OpenWEMI vocabulary(https://ns.dublincore.org/openwemi/

OpenWEMI由都柏林核心元数据倡议(DCMI)支持,显然目标是如都柏林核心(Dublin Core, DC)一样、成为具有超出图书馆界影响力的通用模型。作为一种元模型,对于没有采用WEMI模型的各种元数据标准,可以使用OpenWEMI为需要描述的资源增加层次关系。

按其介绍:OpenWEMI是一个最小约束词表,用于使用作品、内容表达、载体表现、单件等概念描述创建的资源。

与去年提案相比,正式发布的OpenWEMI是一个很纯粹的WEMI模型,排除了责任实体及其属性,只含资源及其关系:

类5个:超级类Endeavor,4个子类即WEMI

属性15个:包括主要关系、共同关系和相关关系。

相关关系认定很宽松。共同关系则是FRBR没有的,指示两个资源表示或包含相同的 openWEMI 实体。

作为“最小约束词表”,主要关系与FRBR有所不同,不严格要求 W—E—M—I 环环相扣,可以省略中间层,如下图,可以W-E-I或W-M-I等(换言之也可以只分3个层次,因为有的领域很难分出4个层次)。下图出自openWEMI的GitHub主页(https://github.com/dcmi/openwemi,目前还是提案内容,但“主要关系”没有变化):

WEMI主要关系

RDA注册中文版上线

RDA注册(RDA Registry,https://www.rdaregistry.info/简体中文版于2024年7月25日上线,是RDA注册的第18种语言版本(有些语言版本仅翻译部分内容)。另据RDA指导委员会的更广泛社区参与专员、纽约大学的周小玲介绍,台湾正在做繁体中文版。

简体中文版完整包含“元素”Elements (RDA element sets) 和“取值”Values (value vocabularies)两部分,共1.8万条目、约40万汉字,工作量巨大,由国家图书馆顾犇老师历时半年独自完成。今后撰写RDA相关文章等,当以RDA注册中文版作为权威的中文术语来源

近日介绍文章在《图书馆建设》2024年第4期发表:顾犇.RDA 注册表——走向网络时代编目工作的基础 [J]. 图书馆建设 ,2024(4):4-8.(文章下载:http://tsgjs.org.cn/CN/Y2024/V328/I4/4

中文版翻译基于 [1] 2014年出版的RDA印刷版的中文版,并参考 [2]《国际标准书目著录 (ISBD)(2011 年统一版之 2021 年更新版 )》中文版的术语和 [3]《国际图联图书馆参考模型》(IFLA LRM)中文版的术语,以及 [4] 国家标准《信息与文献 基础和术语》(GB/T 4894-2024)(报批稿)

当年的RDA中文版由多方合作完成,由于篇幅大、时间紧,存在术语翻译不完全一致的问题,而新RDA又出现了不少新术语,有的还反映的是相同或近似概念。翻译过程中,顾老师曾和我就个别术语的翻译进行过讨论,我们一致的观点是,既要“避免同一个英文术语翻译成不同中文术语,也避免不同英文术语翻译成同一个中文术语”,显然要做到并不容易。文章中举了几个术语的例子,如出自LRM的“aggregate”,因为是新的概念,为避免与其他概念/术语混淆,翻译为“合集”(不用如“汇编”“集合”等), 相应的“aggregating”翻译为“合集性”,“aggregated”翻译为“被编制合集”,“aggregation”翻译为“编制合集”等(均使用“合集”);再如:新概念“successive work”,指“被计划由多种不同的内容表达实现的一种历时作品”,也可译成“连续性作品”,但之前已有“连续性资源”(continuing resource)这个概念、虽然以后不一定会继续使用,但为避免重复而产生歧义,决定译为“相继作品”。文章还介绍了一些其他术语的翻译,如出自LRM的“res”(拉丁语=Thing)、通常译为媒体/媒介的“medium”(多义词、需要不同中译)等。

除RDA注册外,文章还披露了其他相关信息,如2018-2020年中国国家图书馆被选为RDA亚洲地区国家机构代表,2018年4月在亚洲做RDA实施问卷调查,5月作者参加RDA理事会会议。文章还有一节为“RDA工具包中文版的设想”,有助于了解国内编目规则的现状和作者的立场。

上图讲座:美国国会图书馆实施BIBFRAME(附历年PPT分享)

昨天在上海图书馆采编中心做了一个讲座,标题《美国国会图书馆(LC)实施BIBFRAME》(PPT链接附后)。

此事源于年初,采编中心纪主任说在做年度学术计划,想请我做堂讲座,主题为编目发展趋势或者大语言模型相关新技术发展等都可以。我答应了,但坦言还没什么想法。之后一直关注两方面进展。

人工智能很热(也写了几篇介绍博文 https://catwizard.net/posts/tag/ai),但刚起步,没有太多实际应用,基本上还处在设想与规划阶段,比如《PCC人工智能和机器学习战略规划任务组最终报告》(2024-4-15)。编目工作或标准方面则没有什么方向性的变化,最大的期待应该就是美国国会图书馆(LC)明年更换图书馆自动化系统FOLIO后实施BIBFRAME了。

7月1日的BIBFRAME更新论坛透露了一些重要信息,顺藤摸瓜看了些资料,也写了些博文。那天去上图听周小玲讲座(听周小玲讲座:RDA的发展和更新(实施与翻译),2024-7-17),和纪主任沟通后,确定了讲座主题。

历年PPT分享

2008年时注册了Slideshare.net,自己的PPT基本上都上传到那里。2018年时忽然要架梯才能访问了,感觉太不方便,就找了academia.edu作为替代。上传了当年的3个文档,主要给博文做链接。之后好像不是每次有PPT都会写博文,有时主办方也会分享PPT,因此没再上传过文档。

昨天讲座后,想着还是可以分享下PPT。于是今天回到academia.edu,索性把2018年以来的PPT大致都上传了。

再说Slideshare.net在2020年被LinkedIn卖给了scribd.com,目前架梯后仍可访问、上传的PPT也都在,但不知道为什么在搜索框中输入题名基本上查不到。直接访问个人主页还是可以看到。