2024欧洲BIBFRAME研讨会

2024欧洲BIBFRAME研讨会 https://www.bfwe.eu/helsinki_2024(第8届年会),欧美国家图书馆主办,2024/9/17-18在芬兰赫尔辛基,亲身+虚拟混合活动,免费注册与会。会议日程2024/7上线、含报告介绍;2024/10/8报告PPT+视频(YouTube)上线。

以下简单的会议笔记,按个人随感归并排列。

  • LC深度参与会议:首场报告介绍LC动态,又主导第2天的两个圆桌讨论,一是BIBFRAME编辑器的未来(摆脱MARC平面性,使用AI的可能性)、二是BIBFRAME/MARC双格式环境(Modern MARC什么样)。

首场报告内容比2个月前LC主场丰富得多:•关于BIBFRAME:从为什么转向BIBFRAME要花这么长时间(系统、社区、数据),到LC过去3年(2021-2023)今后3年(2024移到BIBFRAME、2025实施Folio、2026适应RDA)的任务。2024年8月LC的重要里程碑——15名编目员开始以BIBFRAME输入记录。•关于MARC:特别说明LC倾向于采用新的3XX字段(代替006-008编码数据字段),BF到MARC转换将逐渐把原260分解为可重复的264等。•关于非拉丁字母数据,BCP47将用于LC的BIBFRAME和转换为MARC。•结语:LC很高兴已经开始转向BIBFRAME;期待将重点从转移(shift)本身,移到BIBFRAME关联数据的开发(exploitation)[这才是吃瓜群众真正的期待];LC将继续提供MARC,但以“现代”形式[modern MARC]。(Sally McCallum: BIBFRAME, MARC, RDA)

  • BIBFRAME编辑器,目前已有3种;另外还有OCLC的编辑器在研发中。

Flanders中央编目,测试3种开源关联数据编目系统:Libris XL、Marva、Sinopia。将选择1种进一步开发。(Lynn Van Kerckhove, Guy Cools: Towards a new way of cataloging in Flanders)

  • BIBFRAME映射,2个报告专论MARC21以外格式的映射:

SHARE Family第一家SHARE Catalogue,最初使用BIBFRAME 1.0。现使用Wikibase.Cloud,做UNIMARC到BIBFRAME 2映射。(Claudio Forziati: The UNIMARC-BIBFRAME mapping in SHARE Catalogue: an evolving path)

韩国公州国立大学李Mihwa教授继2023年后再次与会,讨论KORMARC的映射问题。(Mihwa Lee: KORMARC data mapping for BIBFRAME transforming)

  • 艾利贝斯,今年官宣支持BIBFRAME的Alma已上线。本次会议2个报告介绍各自参与艾利贝斯“关联数据焦点小组”,以特藏测试BIBFRAME的经历:

利兹大学使用Sinopia编目珍稀图书(Trevor Hough, Kim Taylor: Adventures in BIBFRAME: Cataloguing Rare Books Using Sinopia at the University of Leeds)。

迈阿密大学法律图书馆,从Sinopia、经由Alma到Primo(Adina Marciano, Margarita Perez Martinez: Unlocking BIBFRAME: Practical Insights for Alma and Primo)

  • OCLC,前几年感觉在BIBFRAME方面参与度比较低,随着LC开始实施BIBFRAME……

今年报告主题是:在图书馆工作流程中大规模处理关联数据。两部分内容:(1)WorldCat实体,介绍新推出的OCLC推出Meridian(WorldCat实体集成服务工具),也提及OCLC新数据模型:WorldCat本体。(2)BIBFRAME:摄入(测试LC和Sinopia/Alma)、导出(大规模测试,以评估导出BIBFRAME的质量),数据差异问题(OCLC正在努力创建一套高度可靠、一致且对开发人员友好的BIBFRAME数据),编辑器(征召开发合作伙伴测试中)。(Jeff Mixter:  Working with linked data at scale in library workflows)

  • 实施方面:互操作、数据存储、数据完善

互操作BIBFRAME互操作小组(BIG)正在进行的工作。两个下属小组,分别制定用于验证基础BIBFRAME描述(又名BF Interlingua=交际语中间语)的形状指南,开发验证结构(DCTap电子表格的结构,DCTap到SHaCL的转换:DCTAP = Dublin Core Tabular Application Profiles,SHACL = Shapes Constraints Language)。(Nancy Lorimer: BIBFRAME Shapes: Validating our Approach)

蓝色核心计划:意在转变编目模式、停止套录,由一个图书馆联盟维护和运营。除美国高校馆以外,美国国会图书馆也参与其中。期待其3年计划的2025年测试与实施。(Kalli Mathios: Planning and Designing: An Update from Blue Core)。

瑞典国家图书馆:不断完善其数据。去年是“作品”,今年关注归一化书目数据中不同层次的“类型”,据称包含如体裁/形式之类,竟有2000种之多(Andreas Andersson: Normalising and coordinating types in bibliographic data)

  • 多格式、不影响当前编目流程,也是BIBFRAME应用的一个选项?

以Share-VDE开始兴盛的Share Family中心知识库CKB格式无关(MARC21、UNIMARC、BIBFRAME/RDF)。采用SVDE本体(BIBFRAME扩展),与第三方整合(Alma, FOLIO, Sinopia)。(Tiziana Possemato, Serena Cericola: Share Family: advancements in linked data collaboration)

新加坡国家图书馆局的关联数据管理系统(去年年会报告续),即将上线侧栏知识图谱导航。BIBFRAME捕获书目记录的细节,Schema.org为搜索引擎提供结构化数据;Schema.org作为知识图谱的“通用语言”词表。不取代当前的编目流程和实践(Richard Wallis: Building a Semantic Knowledge Graph at National Library Board Singapore)

  • RDA现身本次会议。2023年会的初始日程有RSC报告、但最终没有。

今年报告人为RSC主席,概述RDA的组织结构、修订过程、工具包发布、RDA注册、社区资源、国际合作、切换官方工具包。可全面了解现状,但没有提及与BIBFRAME的映射。(Renate Behrens: News from RDA)

另外还有2个应用RDA的报告:

欧洲厂商Axiell Group的Quria图书馆服务平台:关联数据基于RDA注册、WEMI聚类,各种格式数据经由MARC21导入导出。(Magdalena Olofsson, Emma Tennevall: Linked Data LMS: Experiences from Production)

芬兰国家图书馆的关联数据项目(去年年会报告续):采用BIBFRAME数据模型,与RDA深度整合(BFFI数据模型)——当BIBFRAME与RDA不同时,多遵从RDA(如用WEMI,根据RDA拆分一些BIBFRAME属性)。(Matias Frosterus: Expressions and Aggregates in BIBFRAME)

参见:https://www.bfwe.eu/

BIBFRAME本体2.4版及MARC转换2.7版发布

近日LC网络开发与标准办公室主任Sally McCallum在BIBFRAME邮件组发布信息,BIBFRAME词表2.4及BIBFRAME-MARC双向转换2.7发布。奇怪的是,邮件标题只提转换不提词表(BIBFRAME/MARC conversion update 2.7. https://listserv.loc.gov/cgi-bin/wa?A2=BIBFRAME;a5601218.2409)。找出新版词表和转换的更新内容对照着看,理解到,词表是为MARC字段转换为BIBFRAME而更新,另外还有一些转换更新不涉及词表变化;而BIBFRAME到MARC反向转换主要是相应变化。

2024年7月初BIBFRAME更新论坛,介绍的是BIBFRAME-MARC双向转换2.6。7月中我准备上海图书馆采编中心讲座PPT时,无意发现已更新到2.7(增加758字段作品和实例URI)。但当时不知道词表(本体)也已更新到2.4。目前BIBFRAME网站的新闻也还没有相关信息。

参见:上图讲座:美国国会图书馆实施BIBFRAME(附历年PPT分享)(2024-8-29)/posts/2024/0829/6293

BIBFRAME 2 Ontology——BIBFRAME 2 List View. https://id.loc.gov/ontologies/bibframe.html

词表/本体2.4版更新于 2024-07-10,共16处变化(新增11、其中8之前为bflc,修改5),可归为4组(新增3,修改1):

注:GH为更新问题讨论,链接网址构成方式类似,如GH119,网址为 https://github.com/lcnetdev/bibframe-ontology/issues/119

一、分类号、标识号(类,新增)

  • bf:ClassificationNal,美国国家农业图书馆分类法,bf:Classification子类。(GH119)【MARC 070】
  • bf:OclcNumber,OCLC号,bf:Identifier子类。(GH120)【MARC 035,OCLC号原定义域:bf:Local】

二、关系(类与属性,新增 (GH116))【代替BIBFRAME的LC扩展 bflc:】

  • bf:Relation,关系(关联资源及其与所描述资源的关系)【代替bflc:Relationship】
  • bf:relation,关系【代替bflc:relationship】
  • bf:Relationship,关系类型(资源之间的关系类型)【代替bflc:Relation】
  • bf:relationship,关系类型【代替bflc:relation】
  • bf:associatedResource,关联资源【新增,GH116中为:bf:relatedResource?】

三、出版相关(属性,新增(GH124))【代替BIBFRAME相应的LC扩展 bflc:】

  • bf:distributionStatement,发行说明(通常转录)
  • bf:manufactureStatement,生产说明(通常转录)
  • bf:productionStatement,制造说明(通常转录)
  • bf:publicationStatement,出版说明(通常转录)

四、丛编(属性,更新定义或定义域)【进一步改进490字段创建丛编Hub】

  • bf:hasSeries,有丛编(资源与其发布所在的较大资源之间的关系;组成部分上含较大资源的题名)
  • bf:seriesOf,丛编(较大资源与其包含的资源之间的关系,形成一个丛编,较大资源的题名出现在组成部分上)
  • bf:hasSubseries,有子丛编(资源与其发布所在的较大丛编资源之间的关系;较大的丛编资源是另一个总体丛编资源的一部分)
  • bf:subseriesOf,子丛编(丛编资源与其包含的资源之间的关系,形成子丛编;丛编资源本身与更大的资源有关系,它是其中的组成部分)
  • bf:seriesEnumeration,丛编数量(通常转录)。更新定义域 (GH100)【由Instance扩大为:Work或Instance】

上述“关系”的变化,被称为“新的关系构造”,(以间接关系)反映现有的[RDA]行为者的贡献角色建模,影响到众多MARC字段转换,如7XX$i,760-788关联款目。另外,记录中如果没有240,7XX$t等将作为240创建Hub;对041字段中的语言资源,根据每个子字段中的信息创建特定语言的注释或特定语言的伴随资源。这些信息的揭示及丛编相关属性的更新,应该能有效地改善BIBFRAME对作品和Hub的聚类。

参见:Bibframe Hub 聚类现状(2024-9-16)/posts/2024/0916/6303

— 附:BIBFRAME词表及转换相关博文 —

目前的BIBFRAME 2词表,发布于2016年,自2021年起每年更新一版,是为2.0(2016-04-21)2.1(2021-06-09)2.2(2022-10-03)2.3(2023-11-30)和2.4(2024-7-10)。

MARC到BIBFRAME转换发布于2017年,BIBFRAME到MARC转换发布于2020年。更新频率高于词表,目前大致一年2版(2024年为2.6和2.7版)。

新西兰实施官方RDA并更新MARC

2024年8月1日开始,新西兰国家图书馆(NLNZ)将使用官方RDA工具包来描述印刷和数字专著,并计划在年底前用于所有格式

National Library of New Zealand Using Official RDA Toolkit. 2024-8-7. https://www.rdatoolkit.org/news/rda/national-library-new-zealand-using-official-rda-toolkit

新RDA于2020-12-15切换为官方版,印象中这是RDA官网上首次报道开始实施官方RDA的国家——不过据RDA指导委员会的更广泛社区参与专员周小玲称已有多国实施。

参见:听周小玲讲座:RDA的发展和更新(实施与翻译)(2024-7-17)/posts/2024/0717/6275

NLNZ实施官方RDA的相关资料

MARC字段使用变化

实施官方RDA工具包时对MARC记录进行更改,目的是在将来离开MARC以实现关联数据时,改进元数据的一致性和结构

具体来说,就是使用因RDA更新的MARC字段,并采用相应的RDA取值词表。特别值得注意的是,有两点希望在2025年完成改变,一是停用300$b、以340字段取代,二是停用1XX、均用7XX(理由是RDA从无“主要款目”的概念)。另外由于引入758字段,不再做130/240。比较遗憾的是,示例中一些无效标点、尤其是句末“.”仍然保留。

变化可从与原文件不同的角度,概括为如下四个方面【W=作品,E=内容表达,M=载体表现】

一、使用更多3XX字段/子字段:以官方RDA的4种记录方法来说,从“记录非结构化描述”变为“记录结构化描述”

334 – Mode of Issuance(M-发行方式,新增)334 ## ǂa single unit ǂ2 rdami

335 – Extension Plan(W-扩展计划,新增) 335 ## ǂa static plan ǂ2 rdaep

340 – Physical Medium(物理媒介)

  • 340 ## ǂg colour ǂp illustrations(M-色彩内容/插图内容,重复/将代替)300 ## ǂb colour illustrations(希望停止使用300$b)
  • 340 ## ǂa shellac ǂ2 rdamat(M-材料,代替)007 sducsmcnnmslne

345 – Moving Image Characteristics(动态图像特征)

  • 345 ## ǂc 16:9 ǂd Wide screen(E-纵横比,代替)500 ## $a Aspect ratio: widescreen (16:9).

二、使用专属字段

532 – Accessibility Note(M-无障碍内容)

  • 532 8# ǂa Closed captions for the hearing impaired.(代替“语言”)546 ## Closed captions for the hearing impaired.

758 – Resource Identifier(资源标识符;4种记录方法之“记录IRI”)

  • 758 ## ǂ4 http://rdaregistry.info/Elements/m/P30139 ǂi Expression manifested: ǂa Singh, Nalini, 1977- Archangel’s shadows. English(M-载体表现体现的内容表达/作品,新增;将不再加130/240字段)

三、采用官方RDA术语:

1、术语来源代码ǂ2:采用官方RDA词表编码方案(VES)。如上述3XX中的示例,再如:

336 ## ǂa text ǂ2 rdaco(代替原LC代码表:ǂ2 rdacontent)

2、1XX 和 7XX 字段中的关系说明语:改用官方RDA元素标签。如:

100 ǂa Mahy, Margaret, ǂd 1936-2012, ǂe author person.(代替原RDA:ǂe author.)另外,希望不再用1XX,均用7XX

3、新增本地字段,记录“合集载体表现”的类型:

931 ## ǂa collection aggregate

931 ## ǂa parallel aggregate

四、合订题名不用245ǂb,而是使用ISBD标点中没有的“+”分隔(因为无总题名合集的各组成部分题名共同构成“正题名”?)

正题名-无总题名的“合集”题名:245 00 ǂa Tilly meets a stranger + Ka tūtaki a Tilly i te tauhou(M-正题名)