BIBFRAME/MARC双向转换2.4版发布:拆分多载体资源

2023年11月底,美国国会图书馆(LC)发布了BIBFRAME词表(本体)2.3版和BIBFRAME/MARC双向转换2.4版。

via BIBFRAME Forum: New versions of BIBFRAME/MARC conversions released / Sally H. McCallum. 2023-12-1.

参见:BIBFRAME本体2.3版发布(2023-12-2)

按LC网络开发与标准办公室主任Sally McCallum在BIBFRAME邮件组发布信息的说法, 词表更新相对较少,双向转换的更新更为“实质性”。转换更新主要针对的是单条MARC记录中包含多个载体资源(多个007、300和3XX字段),先将其拆分为多条MARC记录,方便转换为一个作品、多个实例的BIBFRAME;相应地,从BIBFRAME转换、复合重建为对应的单条MARC记录。相对于原来各载体的描述混在一个BIBFRAME实例中无法区分,这确实是个非常重要的质量提升。

Jodi Williamschen和Kevin Ford在7月份的LD4在线会议上介绍了这项工作,可看油管视频和PPT:

Breaking news: Splitting MARC records to create better BIBFRAME data / Kevin Ford and Jodi Williamschen. 2023 LD4 Conference on Linked Data, July 12, 2023. 26 slides.

2.4版有个预处理(Preprocess 0),就是在一个Work中创建不同载体的多个Instance:由原单条MARC记录创建多条精简MARC记录,以新建的MARC758字段(资源标识符)链接。另外:原来入Work的007位的声音内容、色彩内容和相应的34X字段/子字段跟着分拆到Instance

由于MARC编目历史长且资源情况各异,单条MARC记录中包含多个载体资源会有不同做法。比如336-338字段的使用,重复300字段的做法,是在RDA实施后出现的,而MARC到BIBFRAME的转换需要针对所有遗留的MARC记录。 PPT以三个示例介绍不同做法:

  • 例一、照片有对应电子资源:2个007、1个856(其中300/336-338仅各1,对应第1个007;第2个007对应856)
  • 例二、音频盘有配套视频盘附件:2个007、300$e(336-338各2,分别配:第1个007+300$a$b$c,第2个007+300$e)
  • 例三、3个电影胶卷的合集:007/300配对(各3条)

基本做法是:主MARC记录包含连接到第1个007字段,以及所有其余MARC字段;其他MARC记录包含连接到各自007字段、前述相应子段/子字段(如856、300$e、300等),保留共同的008、260/264字段,并新增758字段(形式如 758 \\ $4 http://id.loc.gov/ontologies/bibframe/instanceOf $1 http://example.org/22913073#Work)。

PPT也谈到了转换仍然存在的问题【括号中为本人点评】

  • 无法保证007和300字段的顺序正确【如果完全依赖字段顺序,会有很大问题,应该辅以代码与描述的识别配对】
  • 当两个007字段用于描述资源的同一部分时,会创建额外的MARC记录【简单的重复?问题似乎不太大】
  • 实例标题的不确定性【本无单独著录,无解】

转换代码:

转换规范:

基础数据更新尚在进行中(毕竟MARC记录数量巨大),比较工具已是2.4版实时转换,记录实例

BIBFRAME本体2.2版修订

BIBFRAME 2 版本的修订内容,主要有两个来源:

  • 其一,美国国会图书馆(LC),在 MARC/BIBFRAME 数据转换、BIBFRAME 编目试验等过程中发现;
  • 其二,公开接受建议,可在github中提交发现的问题、发布修订建议,接受质疑与讨论,确定修订后关闭评论。(问题讨论链接issues)https://github.com/lcnetdev/bibframe-ontology/issues

之前写过BIBFRAME本体的2.1版和2.3版更新,下面补上2.2版。参见:

2.2版(https://id.loc.gov/ontologies/bibframe-2-2-0.html)于2022-10-3发布,共28个变化,涉及17个类、11个属性。大致可归为3类:

一、新增类及属性,增强互操作(转换、映射)

1、新增资源类型(bf:Work的子类):(1)Integrating集成性[资源](2)Kit套件(bf:MixedMaterial的子类、bf:MixedMaterial又为bf:Work的子类)(3)Monograph专著/单行资源(4)MusicAudio音乐音频(bf:Audio的子类,bf:Audio又为bf:Work的子类)(5)NonMusicAudio非音乐音频(同MusicAudio)(6)Serial连续性[资源](7)Series丛编。

2、新增类DescriptionLevel / 属性descriptionLevel,对应MARC头标的编码等级(encodingLevel),但更改用词与DescriptionAuthentication、DescriptionConventions一致。

3、新增类Binding / 属性binding,合订方法,对应MARC/RDA结构化描述。

4、新增类Modification(bf:ProvisionActivity的子类),MODS映射时发现BIBFRAME缺少修改日期,本类可包括非日期修改如Agent。

5、新增属性validDate(bf:date的子属性),MODS映射时发现BIBFRAME缺少有效日期;同时也对应于MARC 046 特定编码日期。

二、扩大属性的定义域、值域,减少对应用的限制

1、取消值域:现期望值为rdfs:Resource(所有资源),减少对应用的限制(PCC认可):(1)carrier(原期望值bf:Carrier),(2)content(原bf:Content),(3)intendedAudience(原bf:IntendedAudience),(4)language(原bf:Language),(5)media(原bf:Media)

2、扩大定义域:originPlace(原用于bf:Work),现注释-建议使用:bf:Work 或 bf:Instance(MARC转换,370字段地点适用于作品,257字段地点适用于实例)

三、更正与纠错

1、更改类的定义:MixedMaterial,Multimedia(均为多种类型资源,区别在于是否由软件驱动)

2、修改子类(subClassOf):(1)Collection(添加子类bf:Work),(2)Manuscript(子类由bf:Instance改为bf:Work;对此修改尚有争议,见问题GH92:https://github.com/lcnetdev/bibframe-ontology/issues/92)

3、取消子类。描述/著录相关类,原误作AdminMetadata子类,现取消:(1)DescriptionAuthentication(描述验证)(2)DescriptionConventions(描述规则)(3)GenerationProcess([描述]生成处理)

4、更改属性标签:replacedBy,replacementOf(原分别为:succeededBy,precededBy )

附:Work和Instance的子类(2.3版)

  • bf:Work的子类共18种,加下位子类3种共21种(不含2.3版取消的Hub),其中2.2版新增*7种,修改+2种

Text

Cartography

Audio(子类:MusicAudio*,NonMusicAudio*)

NotatedMusic

NotatedMovement

Dataset

StillImage

MovingImage

Object

Multimedia

MixedMaterial(子类:Kit*)

Manuscript+(由bf:Instance子类改)

Collection+(增加为子类)

Arrangement

Integrating*

Monograph*

Serial*

Series*

  • Instance的子类共5种(其中2.3版新增*1种)

Print,Archival,Tactile,Electronic,Microform*

BIBFRAME本体2.3版发布

BIBFRAME本体2.3版(http://id.loc.gov/ontologies/bibframe-2-3-0/)于2023-11-30发布。因为变化不大,美国国会图书馆(LC)网络开发和标准办公室主任Sally McCallum在BIBFRAME邮件组发布消息的标题是“BIBFFRAME/MARC转换新版发布”(New versions of BIBFRAME/MARC conversions release),在正文中才说明本体更新。

与2.2版(https://id.loc.gov/ontologies/bibframe-2-2-0.html)相比,有9处更新。可分为3组:

一、Hub相关更新

1、bf:Hub(一种抽象资源,充当两个作品之间的桥梁):Hub在2.1版引入,大致对应LRM/RDA的WEMI四层实体中的最上层,但当时是作为bf:Work的子类。本次更新将Hub定义为基本模型类(Basic Model Class),不再是bf:Work子类。

2、bf:hasExpression / bf:ExpressionOf:定义域/值域原为bf:Work。由于Hub不再是Work子类,因此定义域/值域变为:bf:Work 或 bf:Hub

【从模型角度Hub在Work之上,原来定义为Work子类,总觉得有点奇怪,更新后显得正常了。不过还是与LRM/RDA不同,LRM/RDA的WEMI间属性各不相同,而BIBFRAME的 Hub / Work 都用 expression 连接】

二、新增由LC本地扩展BFLC转移到主词表

1、bf:PrimaryContribution:主要责任,bf:Contribution子类

2、bf:TransliteratedTitle:音译题名,bf:VariantTitle子类

3、bf:CaptureStorage:LC录音编目员根据MARC 007/13的要求,bf:SoundCharacteristic子类

4、bf:Relief 类 / bf:relief 属性:LC地图编目员根据MARC 008/18-21的要求

三、社区建议新增

bf:Microform:缩微品,作为bf:Instance的子类。GitHub讨论区有详细的建议理由 (GH101)。

参见:BIBFRAME本体2.1版发布(4层确认)(2021-6-25)