bf:Hub不是作品

想知道BIBFRAME的类Hub(bf:Hub)究竟是什么?博文比较长,先说个人结论:bf:Hub是内容表达(或内容表达组)。间接佐证:bf:Hub在2021年发布时定义为bf:Work的子类,现在bf:hasExpression属性仍同时用于bf:Hub和bf:Work类。

  • 背景

1997年国际图联(IFLA)《书目记录的功能需求》(FRBR)提出书目资源四层实体“作品—内容表达—载体表现—单件”(后常简称WEMI),2017年取代FRBR系列的《IFLA图书馆参考模型》(IFLA LRM)继承此模型。本文中不加限定说明的WEMI均为LRM概念(为方便以lrm:标识),如标题中的“作品”即指lrm:Work。

美国国会图书馆(LC)的BIBFRAME 2.0模型是三层核心类“作品—实例—单件”,bf:Work对应lrm:Work+lrm:Expression。当BIBFRAME 2.1和2.3词表新增bf:Hub(作为两部作品之间桥梁的抽象资源),形成“Hub—作品—实例—单件”四层基本模型类(Basic Model Class),似乎正对应LRM的四层,但BIBFRAME 模型图现在仍是2.0版,没有Hub类

这2个四层实体/类真是一一对应吗?bf:Hub相当于lrm:Work吗?尽管有人这么并列,我之前也这么认为,但每每看到bf:Hub记录,总有点怀疑。上月博文“Bibframe Hub 聚类现状”(2024-9-16,/posts/2024/0916/6303),着重于单条bf:Hub记录,看其侧栏关联的记录。这次希望更详细了解bf:Hub本身,选择原语种为英语的《哈姆雷特》及其中译、《红楼梦》及其英译,略做探究。由于上文所引Nate Trail,bf:Hub数据来自LC相应的规范记录,因此与规范库 (authorities.loc.gov)对照。

  • [1] 作品规范记录对应lrm:expression?

BIBFRAME 2.0 模型只有三层Work—Instance—Item。规范记录对应Bf:Work,书目记录对应bf:Instance,感觉很完美。

如果bf:Hub数据来自LC相应的规范记录。难道规范记录对应bf:Hub?

LC规范库,作品的规范记录大多通过名称-题名查找,少数(如匿名作品)通过题名查找。以莎士比亚《哈姆雷特》为例,查:Shakespeare, William, 1564-1616 hamlet,现有108条结果,约60条标记为规范标目,含中译3条。以下为其中4条:

Shakespeare, William, 1564-1616 hamlet(主记录,关联460条书目记录)

Shakespeare, William, 1564-1616. Hamlet. Chinese(中译,关联1条书目记录)

Shakespeare, William, 1564-1616. Hamlet. Chinese (Lin)(林同济中译,未关联书目记录)

Shakespeare, William, 1564-1616. Hamlet. Chinese (Zhu)(朱生豪中译,未关联书目记录)

LC的题名/名称-题名规范用于书目记录的130/240等字段,同一作品常有多条记录(如上,有不同语种、同一语种不同译本,以及不同选本、部分,等等)。因此作品规范记录显非lrm:Work,更接近lrm:expression。

按编目规则,文献原语种不加语种限定,因此仅有题名、无任何限定的那条记录(我暂称为“主记录”),可对应LRM的代表性内容表达,而非lrm:Work,在规范记录中应该也没有字段给予特别标识。

那么,是不是bf:Work对应lrm:expression,bf:Hub对应lrm:Work?

  • [2] bf:Hub对应什么?

以前大致浏览过bf:Hub检索结果一览,感觉并没有合并相同作品。如前所引,bf:Hub数据来自LC相应的规范记录。从LC规范库与关联数据服务(id.loc.gov)的查询结果对比,两者大部分形式一致,但bf:Hub的结果数(82条)比规范记录数(约60条)还要多出不少。以下1条对应于规范库“主记录”:

Shakespeare, William, 1564-1616 hamlet(主记录)Identified By:Lccn: n80008522

由两者的名称-题名形式对比,推测多出来的那些bf:Hub,应该来自未使用规范形式的书目记录(这些bf:Hub记录中没有LCCN规范记录ID)。回顾先前博文“Hub:BIBFRAME模型下的超级作品”(2020-6-28)/posts/2020/0628/5427,其中所引2019年欧洲BIBFRAME研讨会上Kevin Ford关于bf:Hub的MARC来源的介绍,正是这么说的。可是由于当初的博文误读,结论和标题完全错误

换言之,目前bf:Hub不只对应原有的规范记录以及规范库结果,离lrm:Work距离更远。

  • [3] 四层关系Hub—Work—Work—Instance

特别奇怪的是,从BIBFRAME各类记录侧栏的关系追溯,通常竟然有4层(如果加上Item的话就是5层模型了):

Hub(has Expression)Work(has Expression)Work(has Instance)Instance

猜测在有bf:Hub前,bf:Work兼作品/内容表达,因此有两层?好奇前一层Work的数据何来。另外从数据看,bf:Hub像某种内容表达组。

  • 以《哈姆雷特》主记录为例:

【Bibframe Hub】(有LCCN,对应规范记录)

https://id.loc.gov/resources/hubs/83e65f55-ac8f-fcb8-ea65-120fbbbaccec.html

Title = Hamlet

Identified By = Lccn: n80008522

侧栏:Has Expression = Shakespeare, William, 1564-1616 Hamlet(数十条/名称形式相同,此为第1条)

【Bibframe Work】(无ID,来源不明;与下条“分类号”不同)

https://id.loc.gov/resources/works/7624041.html

Title = Hamlet

Classification = LCC: PR2795.M3 H38

侧栏:Has Expression = Shakespeare, William, 1564-1616 Hamlet, 1751(数十条/名称形式各异,此为第1条)

【Bibframe Work】(无ID,URL标识同instance,对应书目记录)

https://id.loc.gov/resources/works/10026252.html

Title = Hamlet, 1751

Classification = LCC: PR2878.H3 K5 1751a

侧栏:Has Instance = Hamlet, 1751(一条)

【Bibframe Instance】(对应书目记录)

https://id.loc.gov/resources/instances/10026252.html

Title = Hamlet, 1751

Identified By = Lccn: unk84045293

  • 仅偶尔遇3层,即:Hub—Work—Instance

如《哈姆雷特》规范标目中未注明中译者的那条Shakespeare, William, 1564-1616 Hamlet. Chinese(仅1条书目记录) 

【Bibframe Hub】(有LCCN,对应规范记录)

https://id.loc.gov/resources/hubs/35bf8775-775a-4808-8ba0-6d52396cf7a1(长标识)

Title = Hamlet. Chinese

Identified By = Lccn: no2016051867

Note = Data source: (hdg.: 哈姆雷 = Hamulei ; translator, Peng Jingxi)

侧栏:Has Expression = Shakespeare, William, 1564-1616 Hamuleite

【Bibframe Work】(无ID,URL标识同instance;译者与Hub不同)

https://id.loc.gov/resources/works/23394582.html

Title = Hamuleite

Contribution = Fu, Guangming, 1965- (Translator)(傅光明)

侧栏:Has Instance = Hamuleite

【Bibframe Instance】(对应书目记录)

https://id.loc.gov/resources/instances/23394582.html

Title = Hamuleite: Hamlet

Identified By = Lccn: 2023388166 = Isbn: 9787201123844

  • [4] 遗留数据问题

大规模的数据往往经不起细察。曾说自己手黑,随便一查就会发现错误问题。当年关注OPAC 2.0,发现新功能常使一些原本隐藏的数据错误显现出来。这次也一样,上述《哈姆雷特》记录汉译者有问题;《红楼梦》(Cao, Xueqin, approximately 1717-1763,用姓名查可包含各种变异题名结果),看到各种版本混在一起,不同英译本被聚合在一个bf:Work下。

前述[2]中多出来的bf:Hub记录,凸显遗留数据未采用规范形式的问题。[3]中的聚合匹配错误,同样体现数据的各种问题,不一定是错误,也可能由于编目规则的逐步进化。如果通过细化不同时期MARC记录到BIBFRAME的转换规范,减少数据形式上的差异,或有助于降低聚合处理难度。

开放WEMI(openWEMI)词表发布

WEMI是作品(Work)、内容表达(Expression)、载体表现(Manifestation)和单件(Item)的首字母缩略词,出自1997年《书目记录的功能需求》(FRBR),由2017年《国际图联图书馆参考模型》(IFLA LRM)继承,是书目资源描述领域著名的层次模型。

以曹雪芹的《红楼梦》为例说明之。《红楼梦》本身是作品,120回本和80回本、印刷版和语音版等是不同的内容表达,各出版社《红楼梦》版本是不同的载体表现,一套印刷版《红楼梦》是单件。如此标记的结果是,原本关系不明确的各种《红楼梦》书目记录,相互间有了明确的层级关系,在书目数据呈现时可以进行多样化的聚合,有助于用户选择适合自己需求的版本。

WEMI模型不仅适合于描述图书,对其他非物质文化资源也同样适用。比如罗丹的雕塑《思想者》,有多个不同的翻模版,可视为不同的内容表达,当然它同时也是载体表现和单件,对《思想者》拍摄形成的照片则是不同的内容表达/载体表现,如此等等。openWEMI就是希望把WEMI模型扩展到图书馆领域之外。

2023年末,openWEMI发布草案。参见:开放WEMI(openWEMI)提案发布(2023-12-14) 

近日,正式词表发布:OpenWEMI vocabulary(https://ns.dublincore.org/openwemi/

OpenWEMI由都柏林核心元数据倡议(DCMI)支持,显然目标是如都柏林核心(Dublin Core, DC)一样、成为具有超出图书馆界影响力的通用模型。作为一种元模型,对于没有采用WEMI模型的各种元数据标准,可以使用OpenWEMI为需要描述的资源增加层次关系。

按其介绍:OpenWEMI是一个最小约束词表,用于使用作品、内容表达、载体表现、单件等概念描述创建的资源。

与去年提案相比,正式发布的OpenWEMI是一个很纯粹的WEMI模型,排除了责任实体及其属性,只含资源及其关系:

类5个:超级类Endeavor,4个子类即WEMI

属性15个:包括主要关系、共同关系和相关关系。

相关关系认定很宽松。共同关系则是FRBR没有的,指示两个资源表示或包含相同的 openWEMI 实体。

作为“最小约束词表”,主要关系与FRBR有所不同,不严格要求 W—E—M—I 环环相扣,可以省略中间层,如下图,可以W-E-I或W-M-I等(换言之也可以只分3个层次,因为有的领域很难分出4个层次)。下图出自openWEMI的GitHub主页(https://github.com/dcmi/openwemi,目前还是提案内容,但“主要关系”没有变化):

WEMI主要关系

2024年IFLA新项目“UNIMARC未来”及新标准LRMoo等

2024年6月《IFLA标准通讯》第2卷第1期发布(IFLA Standards Newsletter. Volume 2, Issue 1. https://repository.ifla.org/handle/123456789/3413)。参见:《IFLA标准通讯》创刊(2023-3-31)

以下为出自第2卷第1期的2024年国际图联(IFLA)标准动态。

一、新项目:UNIMARC未来

2024年初,UNIMARC常设委员会(PUC)启动“UNIMARC未来”项目。信息来源:UNIMARC for Entity-Relationship Cataloguing: Structuring Principles, Current Situation and Key Issues/ Florence Tfibel (Liaison, Permanent UNIMARC Committee)

项目网页:Future of UNIMARC. https://www.ifla.org/g/unimarc-rg/projects/

  • UNIMARC目前提供两种编目选项,也称编目轨道(cataloguing tracks)1)UNIMARC-ER(实体关系编目);2)“传统”UNIMARC编目。
  • UNIMARC的实体和关系:现在几乎涵盖IFLA LRM模型的所有方面

“UNIMARC未来”项目旨在促进交流、分享和产生关于UNIMARC未来的知识,重点是探索 UNIMARC 的使用范围,提高对其实体关系 (ER) 编目轨道的熟悉程度,并收集有关图书馆社区需求的信息。

目前正进行一项全球调查:Landscape of Data Structure and Exchange Standards Survey. https://1ka.arnes.si/unimarcsurvey2024【2024-7-17,8-4访问,页面锁定、内容为空】。

2024年11月12日将在斯洛文尼亚(及在线)召开第6届 UNIMARC 用户会议:6th UNIMARC Users Meeting: Charting the Course: Future-Forward Cataloguing with UNIMARC. https://www.ifla.org/permanent-unimarc-committee-puc/6th-unimarc-users-meeting/

二、新标准。已批准(但截止2024-8-4均未在IFLA网站查到最新的标准文本)

1、《LRMoo:<国际图联图书馆参考模型>的面向对象定义与映射》(LRMOO: object-oriented definition and mapping from the IFLA Library Reference Model)

LRMoo 1.0版于2024年4月获得国际图联专业委员会批准,取代2016年发布的FRBRoo 2.4版(如同LRM取代FRBR、FRAD、FRSAD),与博物馆界的概念参考模型最新版CIDOC CRM 7.1.3版本兼容,在两个社区发布,CIDOC-CRM网站有PDF/DOC版本:https://www.cidoc-crm.org/lrmoo/fm_releases

2、《国际图联ENSULIB绿色可持续图书馆指南》(IFLA ENSULIB Guidelines for Green and Sustainable Libraries)

IFLA网页显示(The IFLA Guidelines for Green and Sustainable Libraries)https://www.ifla.org/the-ifla-guidelines-for-green-and-sustainable-libraries/,目前正寻求建议与期望,要求2024年9月15日前发送案例。

3、《在线环境下的继续专业发展指南》(Guidelines for Continuing Professional Development in the Online Context)

现有文件《国际图联继续专业发展指导方针:原则和最佳实践》(IFLA Guidelines for Continuing Professional Development: Principles and Best Practices (2016))https://www.ifla.org/files/assets/cpdwl/guidelines/ifla-guidelines-for-continuing-professional-development.pdf的进一步发展。

4、《多元文化社区:图书馆服务指南》(第4版)(Multicultural Communities: Guidelines for Library Services (4th edition))

为移民的图书馆服务,更新2009年第3版(https://repository.ifla.org/bitstream/123456789/462/1/multicultural-communities-en.pdf