2024欧洲BIBFRAME研讨会

2024欧洲BIBFRAME研讨会 https://www.bfwe.eu/helsinki_2024(第8届年会),欧美国家图书馆主办,2024/9/17-18在芬兰赫尔辛基,亲身+虚拟混合活动,免费注册与会。会议日程2024/7上线、含报告介绍;2024/10/8报告PPT+视频(YouTube)上线。

以下简单的会议笔记,按个人随感归并排列。

  • LC深度参与会议:首场报告介绍LC动态,又主导第2天的两个圆桌讨论,一是BIBFRAME编辑器的未来(摆脱MARC平面性,使用AI的可能性)、二是BIBFRAME/MARC双格式环境(Modern MARC什么样)。

首场报告内容比2个月前LC主场丰富得多:•关于BIBFRAME:从为什么转向BIBFRAME要花这么长时间(系统、社区、数据),到LC过去3年(2021-2023)今后3年(2024移到BIBFRAME、2025实施Folio、2026适应RDA)的任务。2024年8月LC的重要里程碑——15名编目员开始以BIBFRAME输入记录。•关于MARC:特别说明LC倾向于采用新的3XX字段(代替006-008编码数据字段),BF到MARC转换将逐渐把原260分解为可重复的264等。•关于非拉丁字母数据,BCP47将用于LC的BIBFRAME和转换为MARC。•结语:LC很高兴已经开始转向BIBFRAME;期待将重点从转移(shift)本身,移到BIBFRAME关联数据的开发(exploitation)[这才是吃瓜群众真正的期待];LC将继续提供MARC,但以“现代”形式[modern MARC]。(Sally McCallum: BIBFRAME, MARC, RDA)

  • BIBFRAME编辑器,目前已有3种;另外还有OCLC的编辑器在研发中。

Flanders中央编目,测试3种开源关联数据编目系统:Libris XL、Marva、Sinopia。将选择1种进一步开发。(Lynn Van Kerckhove, Guy Cools: Towards a new way of cataloging in Flanders)

  • BIBFRAME映射,2个报告专论MARC21以外格式的映射:

SHARE Family第一家SHARE Catalogue,最初使用BIBFRAME 1.0。现使用Wikibase.Cloud,做UNIMARC到BIBFRAME 2映射。(Claudio Forziati: The UNIMARC-BIBFRAME mapping in SHARE Catalogue: an evolving path)

韩国公州国立大学李Mihwa教授继2023年后再次与会,讨论KORMARC的映射问题。(Mihwa Lee: KORMARC data mapping for BIBFRAME transforming)

  • 艾利贝斯,今年官宣支持BIBFRAME的Alma已上线。本次会议2个报告介绍各自参与艾利贝斯“关联数据焦点小组”,以特藏测试BIBFRAME的经历:

利兹大学使用Sinopia编目珍稀图书(Trevor Hough, Kim Taylor: Adventures in BIBFRAME: Cataloguing Rare Books Using Sinopia at the University of Leeds)。

迈阿密大学法律图书馆,从Sinopia、经由Alma到Primo(Adina Marciano, Margarita Perez Martinez: Unlocking BIBFRAME: Practical Insights for Alma and Primo)

  • OCLC,前几年感觉在BIBFRAME方面参与度比较低,随着LC开始实施BIBFRAME……

今年报告主题是:在图书馆工作流程中大规模处理关联数据。两部分内容:(1)WorldCat实体,介绍新推出的OCLC推出Meridian(WorldCat实体集成服务工具),也提及OCLC新数据模型:WorldCat本体。(2)BIBFRAME:摄入(测试LC和Sinopia/Alma)、导出(大规模测试,以评估导出BIBFRAME的质量),数据差异问题(OCLC正在努力创建一套高度可靠、一致且对开发人员友好的BIBFRAME数据),编辑器(征召开发合作伙伴测试中)。(Jeff Mixter:  Working with linked data at scale in library workflows)

  • 实施方面:互操作、数据存储、数据完善

互操作BIBFRAME互操作小组(BIG)正在进行的工作。两个下属小组,分别制定用于验证基础BIBFRAME描述(又名BF Interlingua=交际语中间语)的形状指南,开发验证结构(DCTap电子表格的结构,DCTap到SHaCL的转换:DCTAP = Dublin Core Tabular Application Profiles,SHACL = Shapes Constraints Language)。(Nancy Lorimer: BIBFRAME Shapes: Validating our Approach)

蓝色核心计划:意在转变编目模式、停止套录,由一个图书馆联盟维护和运营。除美国高校馆以外,美国国会图书馆也参与其中。期待其3年计划的2025年测试与实施。(Kalli Mathios: Planning and Designing: An Update from Blue Core)。

瑞典国家图书馆:不断完善其数据。去年是“作品”,今年关注归一化书目数据中不同层次的“类型”,据称包含如体裁/形式之类,竟有2000种之多(Andreas Andersson: Normalising and coordinating types in bibliographic data)

  • 多格式、不影响当前编目流程,也是BIBFRAME应用的一个选项?

以Share-VDE开始兴盛的Share Family中心知识库CKB格式无关(MARC21、UNIMARC、BIBFRAME/RDF)。采用SVDE本体(BIBFRAME扩展),与第三方整合(Alma, FOLIO, Sinopia)。(Tiziana Possemato, Serena Cericola: Share Family: advancements in linked data collaboration)

新加坡国家图书馆局的关联数据管理系统(去年年会报告续),即将上线侧栏知识图谱导航。BIBFRAME捕获书目记录的细节,Schema.org为搜索引擎提供结构化数据;Schema.org作为知识图谱的“通用语言”词表。不取代当前的编目流程和实践(Richard Wallis: Building a Semantic Knowledge Graph at National Library Board Singapore)

  • RDA现身本次会议。2023年会的初始日程有RSC报告、但最终没有。

今年报告人为RSC主席,概述RDA的组织结构、修订过程、工具包发布、RDA注册、社区资源、国际合作、切换官方工具包。可全面了解现状,但没有提及与BIBFRAME的映射。(Renate Behrens: News from RDA)

另外还有2个应用RDA的报告:

欧洲厂商Axiell Group的Quria图书馆服务平台:关联数据基于RDA注册、WEMI聚类,各种格式数据经由MARC21导入导出。(Magdalena Olofsson, Emma Tennevall: Linked Data LMS: Experiences from Production)

芬兰国家图书馆的关联数据项目(去年年会报告续):采用BIBFRAME数据模型,与RDA深度整合(BFFI数据模型)——当BIBFRAME与RDA不同时,多遵从RDA(如用WEMI,根据RDA拆分一些BIBFRAME属性)。(Matias Frosterus: Expressions and Aggregates in BIBFRAME)

参见:https://www.bfwe.eu/

LRM到schema.org映射(荷兰国家图书馆)

荷兰国家图书馆(KB)从2015年开始发布关联数据,采用schema.org。2017年确定采用《IFLA图书馆参考模型》(LRM)、RDA及关联数据发布国家书目,因此制订LRM到schema.org映射作为应用纲要。(出处:René Voorburg. Linked Data Initiatives at the National Library of the Netherlands. Core Linked Data Interest Group forum, 2021-7-29。视频2’20”-16’45”

LRM to Schema.org Cheat sheet (v0.9.3, 2020-11-30) 

目前发布的并非完整映射表,而是一套指南、规则和样例。对于采用schema.org作为词表、以LRM建模时面临的问题有很好的指导,涉及WEMI类及其关系属性,各类连续出版物及其卷、册,Agent(尤其是其中的个人)及Nomen,元数据描述作为实体(不同于实体本身)。摘译如下(命名空间schema:有时简化为s:;编号为本人另拟)

一、WEMI实体

<Work> a schema:CreativeWork .
<Expression> a schema:CreativeWork, schema:ProductGroup.
<Manifestation> a schema:CreativeWork, schema:ProductModel .
<Item> a schema:CreativeWork, schema:IndividualProduct,  schema:ArchiveComponent.

二、连续出版物(表1 Classes for serial publications, groups and member)

 Series: 丛编Volume 卷Issue 期
Generic 通用s:CreativeWorkSeriess:PublicationVolumes:PublicationIssue
Books 图书s:Bookseriess:PublicationVolumes:Book
Periodicals 期刊s:Periodicals:PublicationVolumes:PublicationIssue
Newspapers 报纸s:Newspapers:PublicationVolumes:PublicationIssue
Comic books 漫画书s:ComicSeriess:PublicationVolumes:ComicIssue

三、个人(Person)

LRM和 schema:Person 的“个人”定义并不完全兼容, LRM 实体“个人”仅限于真实人物、明确排除虚构人物,而 schema.org 则包括虚构人物。例如,在 LRM 中,J.K. 罗琳(J.K. Rowling)、罗伯特·加尔布雷思(Robert Galbraith)和实际的乔安妮·罗琳(Joanne Rowling)作为“个人”是相同的;而在schema.org 中,允许将这三个角色(persona)视为三个不同的schema:Persons,可用关系schema:sameAs 将派生自一个LRM个人 的schema:Persons 链接在一起。注意schema:sameAs 与owl:sameAs的语义不同,owl:sameAs 背后的语义本质上会导致将两个 schema:Persons 合并为一个,如此以不同笔名出版的图书、无法推断其在图书上所用名称。

四、命名(Nomen)

不为 LRM命名实体提供对应的 schema.org,仅使用字符串文字或 URI。RDF 允许为字符串指定属性,例如其语言和文字(遵循 BCP4710)。示例:

<URI_of_publisher> schema:name "Paskov Dom"@ru-Latn .
<URI_of_publisher> schema:name "Пашков Дом"@ru .

另以schema:Person 实体聚类 Nomens(作为文字字符串),类似当前管理名称规范记录的做法。

五、WEMI内部关系(Table 2 Hierarchical relations for WEMI entities in schema.org

schema.org只有两层:schema:exampleOfWork(父实体)和schema:workExample(子实体),下表粗体为首选:

object:
subject:WorkExpressionManifestationItem
Works:workExamples:workExamples:workExample
Expressions:exampleOfWorks:workExamples:workExample
Manifestations:exampleOfWorks:exampleOfWorks:workExample
Items:exampleOfWorks:exampleOfWorks:exampleOfWork

六、其他关系

  • 派生:schema:isBasedOn
  • 翻译:schema:translationOfWork
  • 数字化:schema:isBasedOn(载体表现),schema:encodesCreativeWork(单件)
  • 部分与整体:schema:isPartOf / schema:hasPart

七、实体模板和片断

WEMI、个人和元数据共6种实体,提供模板和样例片断,基本包罗了常用元素/属性。如载体表现(其他实体略):

schema:publication [
a schema:PublicationEvent ;
schema:name "{publisher imprint as captured}" ;
schema:startDate "{yyyy}"^^xsd:gYear ;
schema:location "{place as literal <URI>}" ;
schema:publishedBy <{URI_of_Agent_/publisher}> ;
] .
schema:isbn "{isbn}" ;
schema:issn "{issn}" ;
schema:numberOfPages "{literal / integer}" ;
schema:height: "{literal}" ;
schema:width: "{literal}" ;
schema:material "{literal_or_URI}";
schema:image "content_URL or schema:ImageOject" ;
schema:bookEdition "{bookedition}" ;
schema:contributor <{URI_of_contributor}> ;

OCLC弃用BiblioGraph.net词表

OCLC当年因等不及schema.org的图书馆扩展而自行发布书目图谱BiblioGraph.net(BGN),自己曾在文章中介绍。2020年初偶而发现BGN网站跳转到了bibliograph.github.io,并标记“词表弃用”。于是去虚拟国际档(VIAF)和Worldcat网站找RDF文件,看到BGN命名空间的说明还在:xmlns:bgn=”http://bibliograph.net/“,但其中并未使用BGN的类和属性。另外,worldcat.org中还在使用“图书馆扩展”中两个属性:

xmlns:library="http://purl.org/library/"
<library:placeOfPublication>
<library:oclcnum>1126314791</library:oclcnum>

今天找到了BGN于2019年5月发布的说明网页,详细说明BGN词表弃用的原委:BiblioGraph.net Vocabulary – Deprecated

BiblioGraph.net(BGN)是Schema.org的扩展,是为更详尽地描述书目资源而开发的。尽管尚未完全协调,但该“外部”扩展已于2015年5月由“托管”扩展bib.schema.org代替。由于Schema.org的覆盖范围随着时间的推移而发展,并且书目数据的其他关联数据词汇表涌现并逐渐建立起来,因此对Bibliograph.net的需求减少。考虑到这一点,自2019年5月起,该词表已被弃用。BiblioGraph.net网站已移至开放的GitHub存储库BibloGraph-Frozen(https://github.com/bibliograph/BibloGraph-Frozen),以保留其状态并托管该网站,仅供参考。 BiblioGraph.net条款和条件保持不变。同样出于参考目的,在BiblioGraph.net词表中定义的相关术语已映射到Wikidata.org中的等效词。可以使用Wikidata查找覆盖范围,并声明为“等效类”(P1709)和“等效属性”(P1628)声明。 Wikidata类和属性并非旨在在Wikidata本身之外使用,但可以用作在其他命名空间中查找等效项的中心。在一定程度上,除了在网络上爬网Schema.org标记外,搜索引擎还使用Wikidata,仍然可以实现搜索引擎优化的一些潜力。

又去schema.org书目扩展(Schema.org Section: bib),与2016年正式发布的书目扩展比对,原11个属性减少为6个。比对减少的5个属性,全部由托管扩展移入了主要词表:

  • duration – The duration of the item (movie, audio recording, event, etc.) in ISO 8601 date format.
  • pageEnd – The page on which the work ends; for example “138” or “xvi”.
  • pageStart – The page on which the work starts; for example “135” or “xiii”.
  • pagination – Any description of pages that is not separated into pageStart and pageEnd; for example, “1-6, 9, 55” or “10-12, 46-49”.
  • translator – Organization or person who adapts a creative work to different languages, regional differences and technical requirements of a target market, or that translates during some event.

这大概是弃用BGN词表中所称“由于Schema.org的覆盖范围随着时间的推移而发展”的一个证明吧。

存档BiblioGraph的GitHub存储库(https://github.com/bibliograph),有唯一关注者Jeffrey Young,应该是BGN项目的操作人吧。以前因为听说他是曾蕾老师的学生,一直以为他很年轻,这次看照片+简历,才知道很沧桑了。

参见:

文章摘录:国外书目RDF词表的进展与趋势(《图书馆杂志》2015年第5期)

2.5 联机计算机图书馆中心(OCLC):
Schema.org扩展OCLC自2011年起实验采用schema.org作为基本词表,向搜索引擎曝光图书馆元数据。2012年OCLC将其全球联合目录WorldCat用schema.org发布为关联数据,对schema.org缺少部分加以扩展,称为schema.org的图书馆扩展。为谋求将“图书馆扩展”融入schema.org,同年OCLC牵头成立W3C的Schema书目扩展小组SchemaBibEx,目标是提交建议给WebSchemas小组,扩展Schema.org词表,强化其描述书目资源的能力。
由于SchemaBibEx小组进展乏力,OCLC在2014年上半年注册了BiblioGraph.net网站(命名空间简称bgn:,以下简称BGN),基于schema.org词表,增加在“图书馆和相关领域中书目和文化遗产资源与收藏的概念、实体和关系”。2014年下半年起,虚拟国际规范档(VIAF)和WorldCat中已开始陆续采用新的BGN命名空间。