bf:Hub不是作品

想知道BIBFRAME的类Hub(bf:Hub)究竟是什么?博文比较长,先说个人结论:bf:Hub是内容表达(或内容表达组)。间接佐证:bf:Hub在2021年发布时定义为bf:Work的子类,现在bf:hasExpression属性仍同时用于bf:Hub和bf:Work类。

  • 背景

1997年国际图联(IFLA)《书目记录的功能需求》(FRBR)提出书目资源四层实体“作品—内容表达—载体表现—单件”(后常简称WEMI),2017年取代FRBR系列的《IFLA图书馆参考模型》(IFLA LRM)继承此模型。本文中不加限定说明的WEMI均为LRM概念(为方便以lrm:标识),如标题中的“作品”即指lrm:Work。

美国国会图书馆(LC)的BIBFRAME 2.0模型是三层核心类“作品—实例—单件”,bf:Work对应lrm:Work+lrm:Expression。当BIBFRAME 2.1和2.3词表新增bf:Hub(作为两部作品之间桥梁的抽象资源),形成“Hub—作品—实例—单件”四层基本模型类(Basic Model Class),似乎正对应LRM的四层,但BIBFRAME 模型图现在仍是2.0版,没有Hub类

这2个四层实体/类真是一一对应吗?bf:Hub相当于lrm:Work吗?尽管有人这么并列,我之前也这么认为,但每每看到bf:Hub记录,总有点怀疑。上月博文“Bibframe Hub 聚类现状”(2024-9-16,/posts/2024/0916/6303),着重于单条bf:Hub记录,看其侧栏关联的记录。这次希望更详细了解bf:Hub本身,选择原语种为英语的《哈姆雷特》及其中译、《红楼梦》及其英译,略做探究。由于上文所引Nate Trail,bf:Hub数据来自LC相应的规范记录,因此与规范库 (authorities.loc.gov)对照。

  • [1] 作品规范记录对应lrm:expression?

BIBFRAME 2.0 模型只有三层Work—Instance—Item。规范记录对应Bf:Work,书目记录对应bf:Instance,感觉很完美。

如果bf:Hub数据来自LC相应的规范记录。难道规范记录对应bf:Hub?

LC规范库,作品的规范记录大多通过名称-题名查找,少数(如匿名作品)通过题名查找。以莎士比亚《哈姆雷特》为例,查:Shakespeare, William, 1564-1616 hamlet,现有108条结果,约60条标记为规范标目,含中译3条。以下为其中4条:

Shakespeare, William, 1564-1616 hamlet(主记录,关联460条书目记录)

Shakespeare, William, 1564-1616. Hamlet. Chinese(中译,关联1条书目记录)

Shakespeare, William, 1564-1616. Hamlet. Chinese (Lin)(林同济中译,未关联书目记录)

Shakespeare, William, 1564-1616. Hamlet. Chinese (Zhu)(朱生豪中译,未关联书目记录)

LC的题名/名称-题名规范用于书目记录的130/240等字段,同一作品常有多条记录(如上,有不同语种、同一语种不同译本,以及不同选本、部分,等等)。因此作品规范记录显非lrm:Work,更接近lrm:expression。

按编目规则,文献原语种不加语种限定,因此仅有题名、无任何限定的那条记录(我暂称为“主记录”),可对应LRM的代表性内容表达,而非lrm:Work,在规范记录中应该也没有字段给予特别标识。

那么,是不是bf:Work对应lrm:expression,bf:Hub对应lrm:Work?

  • [2] bf:Hub对应什么?

以前大致浏览过bf:Hub检索结果一览,感觉并没有合并相同作品。如前所引,bf:Hub数据来自LC相应的规范记录。从LC规范库与关联数据服务(id.loc.gov)的查询结果对比,两者大部分形式一致,但bf:Hub的结果数(82条)比规范记录数(约60条)还要多出不少。以下1条对应于规范库“主记录”:

Shakespeare, William, 1564-1616 hamlet(主记录)Identified By:Lccn: n80008522

由两者的名称-题名形式对比,推测多出来的那些bf:Hub,应该来自未使用规范形式的书目记录(这些bf:Hub记录中没有LCCN规范记录ID)。回顾先前博文“Hub:BIBFRAME模型下的超级作品”(2020-6-28)/posts/2020/0628/5427,其中所引2019年欧洲BIBFRAME研讨会上Kevin Ford关于bf:Hub的MARC来源的介绍,正是这么说的。可是由于当初的博文误读,结论和标题完全错误

换言之,目前bf:Hub不只对应原有的规范记录以及规范库结果,离lrm:Work距离更远。

  • [3] 四层关系Hub—Work—Work—Instance

特别奇怪的是,从BIBFRAME各类记录侧栏的关系追溯,通常竟然有4层(如果加上Item的话就是5层模型了):

Hub(has Expression)Work(has Expression)Work(has Instance)Instance

猜测在有bf:Hub前,bf:Work兼作品/内容表达,因此有两层?好奇前一层Work的数据何来。另外从数据看,bf:Hub像某种内容表达组。

  • 以《哈姆雷特》主记录为例:

【Bibframe Hub】(有LCCN,对应规范记录)

https://id.loc.gov/resources/hubs/83e65f55-ac8f-fcb8-ea65-120fbbbaccec.html

Title = Hamlet

Identified By = Lccn: n80008522

侧栏:Has Expression = Shakespeare, William, 1564-1616 Hamlet(数十条/名称形式相同,此为第1条)

【Bibframe Work】(无ID,来源不明;与下条“分类号”不同)

https://id.loc.gov/resources/works/7624041.html

Title = Hamlet

Classification = LCC: PR2795.M3 H38

侧栏:Has Expression = Shakespeare, William, 1564-1616 Hamlet, 1751(数十条/名称形式各异,此为第1条)

【Bibframe Work】(无ID,URL标识同instance,对应书目记录)

https://id.loc.gov/resources/works/10026252.html

Title = Hamlet, 1751

Classification = LCC: PR2878.H3 K5 1751a

侧栏:Has Instance = Hamlet, 1751(一条)

【Bibframe Instance】(对应书目记录)

https://id.loc.gov/resources/instances/10026252.html

Title = Hamlet, 1751

Identified By = Lccn: unk84045293

  • 仅偶尔遇3层,即:Hub—Work—Instance

如《哈姆雷特》规范标目中未注明中译者的那条Shakespeare, William, 1564-1616 Hamlet. Chinese(仅1条书目记录) 

【Bibframe Hub】(有LCCN,对应规范记录)

https://id.loc.gov/resources/hubs/35bf8775-775a-4808-8ba0-6d52396cf7a1(长标识)

Title = Hamlet. Chinese

Identified By = Lccn: no2016051867

Note = Data source: (hdg.: 哈姆雷 = Hamulei ; translator, Peng Jingxi)

侧栏:Has Expression = Shakespeare, William, 1564-1616 Hamuleite

【Bibframe Work】(无ID,URL标识同instance;译者与Hub不同)

https://id.loc.gov/resources/works/23394582.html

Title = Hamuleite

Contribution = Fu, Guangming, 1965- (Translator)(傅光明)

侧栏:Has Instance = Hamuleite

【Bibframe Instance】(对应书目记录)

https://id.loc.gov/resources/instances/23394582.html

Title = Hamuleite: Hamlet

Identified By = Lccn: 2023388166 = Isbn: 9787201123844

  • [4] 遗留数据问题

大规模的数据往往经不起细察。曾说自己手黑,随便一查就会发现错误问题。当年关注OPAC 2.0,发现新功能常使一些原本隐藏的数据错误显现出来。这次也一样,上述《哈姆雷特》记录汉译者有问题;《红楼梦》(Cao, Xueqin, approximately 1717-1763,用姓名查可包含各种变异题名结果),看到各种版本混在一起,不同英译本被聚合在一个bf:Work下。

前述[2]中多出来的bf:Hub记录,凸显遗留数据未采用规范形式的问题。[3]中的聚合匹配错误,同样体现数据的各种问题,不一定是错误,也可能由于编目规则的逐步进化。如果通过细化不同时期MARC记录到BIBFRAME的转换规范,减少数据形式上的差异,或有助于降低聚合处理难度。

BIBFRAME作品:如何查找多个实例

BIBFRAME 2.0采用“作品Work—实例Instance—单件Item”三层模型,bf:Work 对应于FRBR的“作品Work”和“内容表达Expression”。BIBFRAME更新到2.X后,或许应该是 bf:Hub 对应“作品W”,bf:Work 对应“内容表达E”。

无论怎么说,一个内容表达有多个实例/载体表现Manifestation是很常见的情况,比如《红楼梦》有不同出版社出版。但在美国国会图书馆(LC)的BIBFRAME数据中,却很难找到例子。目前Bibframe Work记录,右栏“Has Instance”基本上都只下挂一条实例记录(如:https://id.loc.gov/resources/works/7375470.html)。

最近有人在BIBFRAME邮件组询问这个问题,LC的 Nate Trail 回复,说明通过LC关联数据服务(id.loc.gov)的BIBFRAME Instances查询(https://id.loc.gov/search/?q=cs:http://id.loc.gov/resources/instances),[左栏]有分面“Secondary Instance”,由此可查到“次要实例”,他认为次要实例可能是印刷文本的电子版。

按上述指点,确实查到不少“Has Instance”有2条实例的Bibframe Work记录,看到的都是印刷品及其电子版。

是不是说,LC目前仅将确定为同一文本的多种媒介作为相同的内容表达(如印刷品及数字化的电子版)?毕竟不同出版社出版的版本,是否为相同的内容表达,在书目数据中没有可作出判断的依据时(如是否重印),如此处理才是严谨的。

至于同一本书的不同版本(如第1版、第2版),显然是不同的内容表达,不应该出现在Bibframe Work记录的“Has Instance”,而是在Bibframe Hub(或Bibframe Work?)记录的“Has Expression”。

CALIS(中国高等教育文献保障系统)的RDA培训,有一小节专门讲如何判断手头文献是新的载体表现、新的内容表达还是新的作品,如何制作具有不同特征的书目记录。但实施RDA之前的记录可能没有这样的特征。最近新西兰实施官方RDA,MARC引入758字段“资源标识符”,记录作品/内容表达的标识符,将有助于未来的书目数据聚类。LC最新BIBFRAME/MARC转换v2.7也已增加758字段资源标识符。参见:

附:如何查看“次要实例”

由于LC关联数据服务(id.loc.gov)查询结果显示问题,目前要查看“次要实例”记录,还需要一点小技巧:

  • 【第1步】BIBFRAME Instances

网址:https://id.loc.gov/search/?q=cs:http://id.loc.gov/resources/instances

点左栏分面:Secondary Instance

此时结果栏 {Label} 内容为空,不知道是什么记录,也无法点击跳转(下行是第1个查询结果)

  1. {Label}   {Dataset} BIBFRAME Instances {Type} Instance ; SecondaryInstance {Identifier} 22234936-85X-1
  • 【第2步】试着取 {Identifier} 构成以下访问网址:

https://id.loc.gov/resources/instances/22234936-85X-1.html

Bibframe Instance

Title:digital file from b&w film copy neg.

右栏:Instance Of:[Captain Charles Ludlow]

  • 【第3步】点击右栏链接跳转到对应作品:Bibframe Work

网址:https://id.loc.gov/resources/works/22234936.html

Title:[Captain Charles Ludlow]

右栏:Has Instance [有2个实例]

[1891]

digital file from b&w film copy neg. [经由照相负片数字化的文档]

  • 【第4步】点击右栏2个链接跳转到对应实例:Bibframe Instance

经查看,是1891年某刊的图片复制品,以及其数字化版本(https://loc.gov/pictures/resource/cph.3a04452/

BIBFRAME本体2.4版及MARC转换2.7版发布

近日LC网络开发与标准办公室主任Sally McCallum在BIBFRAME邮件组发布信息,BIBFRAME词表2.4及BIBFRAME-MARC双向转换2.7发布。奇怪的是,邮件标题只提转换不提词表(BIBFRAME/MARC conversion update 2.7. https://listserv.loc.gov/cgi-bin/wa?A2=BIBFRAME;a5601218.2409)。找出新版词表和转换的更新内容对照着看,理解到,词表是为MARC字段转换为BIBFRAME而更新,另外还有一些转换更新不涉及词表变化;而BIBFRAME到MARC反向转换主要是相应变化。

2024年7月初BIBFRAME更新论坛,介绍的是BIBFRAME-MARC双向转换2.6。7月中我准备上海图书馆采编中心讲座PPT时,无意发现已更新到2.7(增加758字段作品和实例URI)。但当时不知道词表(本体)也已更新到2.4。目前BIBFRAME网站的新闻也还没有相关信息。

参见:上图讲座:美国国会图书馆实施BIBFRAME(附历年PPT分享)(2024-8-29)/posts/2024/0829/6293

BIBFRAME 2 Ontology——BIBFRAME 2 List View. https://id.loc.gov/ontologies/bibframe.html

词表/本体2.4版更新于 2024-07-10,共16处变化(新增11、其中8之前为bflc,修改5),可归为4组(新增3,修改1):

注:GH为更新问题讨论,链接网址构成方式类似,如GH119,网址为 https://github.com/lcnetdev/bibframe-ontology/issues/119

一、分类号、标识号(类,新增)

  • bf:ClassificationNal,美国国家农业图书馆分类法,bf:Classification子类。(GH119)【MARC 070】
  • bf:OclcNumber,OCLC号,bf:Identifier子类。(GH120)【MARC 035,OCLC号原定义域:bf:Local】

二、关系(类与属性,新增 (GH116))【代替BIBFRAME的LC扩展 bflc:】

  • bf:Relation,关系(关联资源及其与所描述资源的关系)【代替bflc:Relationship】
  • bf:relation,关系【代替bflc:relationship】
  • bf:Relationship,关系类型(资源之间的关系类型)【代替bflc:Relation】
  • bf:relationship,关系类型【代替bflc:relation】
  • bf:associatedResource,关联资源【新增,GH116中为:bf:relatedResource?】

三、出版相关(属性,新增(GH124))【代替BIBFRAME相应的LC扩展 bflc:】

  • bf:distributionStatement,发行说明(通常转录)
  • bf:manufactureStatement,生产说明(通常转录)
  • bf:productionStatement,制造说明(通常转录)
  • bf:publicationStatement,出版说明(通常转录)

四、丛编(属性,更新定义或定义域)【进一步改进490字段创建丛编Hub】

  • bf:hasSeries,有丛编(资源与其发布所在的较大资源之间的关系;组成部分上含较大资源的题名)
  • bf:seriesOf,丛编(较大资源与其包含的资源之间的关系,形成一个丛编,较大资源的题名出现在组成部分上)
  • bf:hasSubseries,有子丛编(资源与其发布所在的较大丛编资源之间的关系;较大的丛编资源是另一个总体丛编资源的一部分)
  • bf:subseriesOf,子丛编(丛编资源与其包含的资源之间的关系,形成子丛编;丛编资源本身与更大的资源有关系,它是其中的组成部分)
  • bf:seriesEnumeration,丛编数量(通常转录)。更新定义域 (GH100)【由Instance扩大为:Work或Instance】

上述“关系”的变化,被称为“新的关系构造”,(以间接关系)反映现有的[RDA]行为者的贡献角色建模,影响到众多MARC字段转换,如7XX$i,760-788关联款目。另外,记录中如果没有240,7XX$t等将作为240创建Hub;对041字段中的语言资源,根据每个子字段中的信息创建特定语言的注释或特定语言的伴随资源。这些信息的揭示及丛编相关属性的更新,应该能有效地改善BIBFRAME对作品和Hub的聚类。

参见:Bibframe Hub 聚类现状(2024-9-16)/posts/2024/0916/6303

— 附:BIBFRAME词表及转换相关博文 —

目前的BIBFRAME 2词表,发布于2016年,自2021年起每年更新一版,是为2.0(2016-04-21)2.1(2021-06-09)2.2(2022-10-03)2.3(2023-11-30)和2.4(2024-7-10)。

MARC到BIBFRAME转换发布于2017年,BIBFRAME到MARC转换发布于2020年。更新频率高于词表,目前大致一年2版(2024年为2.6和2.7版)。