2019欧洲BIBFRAME研讨会

欧洲BIBFRAME研讨会(EBW)始于2017年秋,此后成为年会。2019年第三届于2019/9/17-18在斯德哥尔摩瑞典国家图书馆举办,有来自20个国家的93人参会。2020年第四届原定在匈牙利国家图书馆召开,不知到秋天COVID-19是否能消减而正常召开。

瑞典国家图书馆(KB)作为第三届的举办单位有多个报告,介绍他们的Libris XL,可以说是首个正式使用的基于BIBFRAME的联合目录系统。意大利厂商Casalini-@Cult的Tiziana Possemato也有多个报告,他本人及其他人的报告中频繁出现Share-VDE,是既有应用、又在发展中的系统。另外,美国国会图书馆(LC)及LD4P的斯坦福等也有多个报告,涉及不同方面。

第2天的报告分为五个方面,有说明语,体现当前本领域的关注点:关注身份、关注[数据]更改、关注基础架构、关注关系、关注编辑器。

European BIBFRAME Workshop 2019. National Library of Sweden, Stockholm, September 17 and 18, 2019

以下为本次会议报告一览及简介,题名按PPT修改(与会议报告面页不尽一致)。

(第一天)

  • BIBFRAME expansion and access / Sally H. McCallum, LC // BIBFRAME:扩展与获取【BIBFRAME进展】
  • LD4P: Pathway to Implementation / Philip E. Schreur, Stanford, LD4P // LD4P:实施之路【LD4P项目,以及下一个项目(发现,自持续PCC数据池,扩展Sinopia,扩展询问规范,扩展培训计划)】
  • National library platform based on BIBFRAME / Niklas Lindström, KB // 基于BIBFRAME的国家图书馆平台【瑞典国家图书馆基于BIBFRAME2.0的联合目录系统Libris XL】
  • Possible extensions of BIBFRAME in modelling data / Tiziana Possemato, Casalini-@Cult // 建模数据中BIBFRAME的可能扩展【Share-VDE超级作品,如何在共享环境中管理实例】
  • RDA and BIBFRAME at the Library of Congress / Sally H. McCallum and Jodi Williamschen, LC // 美国国会图书馆的RDA和BIBFRAME
  • RDA WORKS IN BIBFRAME & SINOPIA PROFILES / Nancy Lorimer, Stanford // BF和Sinopia配置文件中的RDA作品【LD4P的BIBFRAME编辑Sinopia如何处理作品/内容表达】
  • Working with BIBFRAME at the National Library of Sweden / Fredrik Klingwall, KB // 瑞典国家图书馆与BIBFRAME共舞【Libris XL词表,基于BF2】
  • Opus Ex Machina: Modelling SuperWork, Work, and Instance Entities in BIBFRAME / Ian Bigelow, University of Alberta // Opus Ex Machina:在BIBFRAME中建模超级作品、作品和实例实体【Share-VDE的作品ID工作组;超级作品,对应BF的Hub】
  • Community-building and Extending BIBFRAME for Special Collections: the Art & Rare Material BIBFRAME Ontology Extensions and the LD4P Rare Materials Affinity Group / Jason Kovari, Cornell 等 // 为特藏社区建设与扩展BIBFRAME:艺术和珍稀资料BIBFRAME本体扩展和LD4P珍稀资料亲和小组【LD4P的本体ARM(ArtFrame和RareMat)和LD4P珍稀资料亲和小组(RM-AG)】
  • BIBFRAME Agent data from MARC authority records – is it an unnecessary redundancy? / Miklós Hubay, National Széchényi Library Hungary // 从MARC规范记录中获取的BIBFRAME施事者数据——不必要的冗余?【BF1到BF2对规范的处理。MARC$0问题?】
  • Linked Data in the LSP * FOLIO and Linked Open Data * Reality, Speculation, Provocation / Charlotte Whitt, Index Data // 图书馆服务平台中的关联数据:FOLIO和关联数据【Index Data自我介绍及FOLIO概述】
  • PCC Task Group on Metadata Application Profiles / Jackie Shieh, Smithsonian // PCC元数据应用配置文件任务组【元数据应用配置文件简称MAP】
  • RERO THROWN INTO BIBFRAME / Nicolas Prongué, RERO //【介绍瑞士公司应用BIBFRAME情况及问题】
  • Challenges on transforming data in RDA vocabulary to BIBFRAME / Michalis Sfakakis, 希腊爱奥尼亚大学 // 转换RDA词表数据到BIBFRAME的挑战【因RDA的4层与BF的3层模型导致的BF虚假关系问题】
  • The Relevance of BIBFRAME Beyond our Walls / Richard Wallis // BIBFRAME超越壁垒的意义【Richard Wallis的第一天小结发言:认为BF在图书馆界之外缺乏相关性,需要与schema.org结合,呼吁参与似乎颇为冷清的W3C的BIBFRAME2Schema.org社区小组】

(第二天)

Panel 1: Concerning Identities 关注身份

我们谈论的是一个新环境,在该环境中我们可以扩展我们的资源来管理身份,特别是名称规范。我们想使用哪些来源? Wikidata? ISNI?NACO?// 例如,当我们指向包含20个标签的VIAF资源时,它如何工作?机构是否仍具有本地规范档?这是否意味着该机构应该托管一个类似于ID.LOC.GOV或DATA.DNB.DE的小型关联数据网站?// 规范描述是否仍需要遵循特定规则来构建规范检索点?如果规范位于本地系统之外,如何执行规则?是否需要服务中心来维护描述以及描述所需的URI?有没有免费的服务?所有描述都驻留在“本地”文件中还是有些保留在带有链接的其他站点上?// 当机器使用标识符运行时,人们需要标签:标签缓存如何适合图片?是否有服务收集使用的不同文件,而不是将所有内容存储在本地?本次会议不为讨论RWO(真实世界对象)、标识符和名称标签。真正的问题是在公共环境中工作。

  • The Cluster Knowledge Base approach to identities management / Tiziana Possemato, @Cult-Casalini Libri // 集群知识库身份管理方法【Share-VDE的集群知识库Sapientia】
  • Concerning Identities: For Things, but not the easy Things [Contains Hubs Part I] / Kevin Ford, LC // 关于身份:针对事物,但不是简单事物(含Hub 第1部分)【BF的Hub】

Panel 2: Concerning Changes 关注更改

在当前环境中,我们有不同的方式来提供更改并将更改应用于资源描述。如何将其转换为RDF/三元组存储环境? 我们是否需要表示已对他人使用的描述进行了更改? 如果是这样,存在什么策略,或者我们可能考虑将更改传达给下游消费者?// 我们是否需要在本地或共享系统中显示三元组的出处? 记录谁做出了更改会成为三元组/断言的挑战? 是否有本地跟踪的更改以及共享的其他更改?// 哪些类型的更改需要通知,例如标签更改,主题的添加/删除或仅在资源更改时通知? 是否需要修改本地系统和本地实践?

  • BIBFRAME CHANGE MANAGEMENT / Nate Trail, LC // BIBFRAME对变化的管理【基于图的方法处理更改】
  • Use case implications for change / Tiziana Possemato @Cult-Casalini Libri // 更改的用例含义【创建、更新、删除实体。Share-VDE的集群知识库(CKB)维护工作组】

Panel 3: Concerning Infrastructure 关注基础架构

为了支持RDF/关联数据,我们需要提供描述和URI的基础架构。例如,美国国会图书馆已将http://id.loc.gov内置到数据源中,以帮助在我们的BIBFRAME数据库中添加URI,并支持用于创建描述的查找和其他助手。虽然LC已使其他人可以访问ID,但我们希望任何机构或网络都需要使用自己的此类工具版本来支持描述创建和检索。 其他人如何处理此基础架构需求?

  • Running the Sinopia Stack on Amazon Web Services / Jeremy Nelson // 在亚马逊Web服务上运行Sinopia【原链接误为作者另一报告】
  • LC BIBFRAME INFRASTRUCTURE / Nate Trail, LC // LC的BIBFRAME基础设施【如何让LC关联数据服务、BIBFRAME编辑器、BIBFRAME数据库一起工作】
  • Finto service for controlled vocabularies as a component of Linked Data cataloging / Osma Suominen, 芬兰国家图书馆 // 作为关联数据编目组成部分的受控词表Finto服务

Panel 4: Concerning Relationships 关注关系

关系是新环境的基石。在机构或网络中,如何处理它们?机构内外资源之间的关系如何处理?其他机构是否看到需要诸如Hubs(美国国会图书馆)或Superworks(Casalini)之类的总体收集设备的需求?此链接的主要组成部分是什么?// 将旧数据从MARC转换为BIBFRAME并(可能)转换回MARC的挑战是什么?

  • Performances and Works: THE INTERACTION OF WORKS AND EVENTS IN MODELING SOUND RECORDINGS IN BIBFRAME & PMO / Nancy Lorimer, Stanford // 表演音乐中的事件和作品和关系【表演音乐本体(PMO)扩展BF,BF事件模型。Sinopia的相关模板】
  • Concerning Relationships: Hubs Part II / Kevin Ford, LC // 考虑关系:Hub 第2部分【Hub的MARC来源,及作为聚合器的3个功能(主题、相关作品、RDA意义的作品)】
  • SuperWorks, MasterInstance and relationships / Tiziana Possemato, @Cult-Casalini Libri // 超级作品、主实例和关系【Share-VDE咨询委员会及子委员会正讨论发展Share-VDE实例由描述到实体】
  • Extensions for past and future relationships / Fredrik Klingwall, KB // 为过去和未来关系扩展【个人名称的呈现问题】

Panel 5: Concerning Editors 关注编辑器

创建和修改Bibframe描述的编辑器是移至BIBFRAME环境所需的主要开发。在这种新环境中,哪些附加功能将有助于编目人员有效而丰富地描述图书馆资源?// 我们是否必须逐个编辑RDF资源,这对于编目员来说可能效率低下,还是我们可以通过RDF图来编辑,这在技术上更具挑战性? 如果按图显示,确定要加载到编辑器中的图的范围以及如何将其保存回来(即删除/替换已编辑的图)有哪些挑战?// 配置文件的最佳用途是什么? 对属于与编辑配置文件不匹配的图的描述性元素(三元组)怎么处理? 编辑始于MARC且因此没有明确配置文件的描述有哪些复杂性?

  • Sidestepping the graph – Sinopia Linked Data Editor’s approach for editing RDF / Jeremy Nelson // 回避图——Sinopia关联数据编辑器的编辑RDF方法
  • Editing JSON-LD at the National Library of Sweden : copying from Fredrik, Ola et al / Niklas Lindström // 在瑞典国家图书馆编辑JSON-LD【编辑命名图为JSON-LD,使用应用本体、Lens和2种b节点(内容确实复制自其他PPT)】

前两届会议介绍博文:

《BIBFRAME手册》之编辑器和数据库

美国国会图书馆(LC)2019年7月发布的BIBFRAME手册《BIBFRAME编辑器和BIBFRAME数据库》,主要面向使用BIBFRAME编辑器的编目员。

Library of Congress BIBFRAME Manual: The BIBFRAME Editor and BIBFRAME Database. Prepared by Policy, Training, and Cooperative Programs Division, Library of Congress. 2019. 113 pages

手册后附词汇表,含术语及解释。以下列出所有术语及部分解释(BF=BIBFRAME),备查(特别关注:Clone, Field, Stub)。

  • Administrative Metadata / 管理元数据
  • BIBFRAME Database / BIBFRAME数据库(存放所有BF描述的数据存储)
  • BIBFRAME Editor / BIBFRAME编辑器(编目员用BF描述资源的界面)
  • Clone / 克隆(BF编辑器配置文件中的一个功能,编目员可以为一个资源集设置标准化描述,共享相似数据)
  • Data Boxes / 数据框(显示在一个字段中输入的特定数据的框)
  • Dereferencable URI / 可引用URI(是一种资源检索机制,它使用HTTP来获取其标识的资源的副本或表示形式。 如果语义Web数据是根据最佳关联数据实践发布的,则标识Thing的URI与标识描述Thing的Web文档的URI不同)
  • Description / 描述
  • Dialog Field / 对话框字段
  • Direct-Entry Field / 直接输入字段
  • Fields / 字段(输入编目数据的模板上的单独空间)【与MARC不同的含义,是否应当用不同的翻译?】
  • Field Edit Buttons / 字段编辑按钮(“笔”修改数据;“垃圾筒”删除数据)
  • ID.LOC.GOV / LC关联数据服务
  • Instance / 实例
  • Internationalized Resource Identifier (IRI)
  • Item / 单件
  • JSON-LD(BF编辑器中,用JSON-LD序列化编目员输入的描述)
  • Linked Data / 关联数据
  • Lookup / 查找(亦称“自动完成”)
  • Post / 发布(BF编辑器功能,用于发送完成的资源描述到BF数据库)
  • Profile / 配置文件(创建资源或概念描述的在线模板。在BF编辑器2.0中有:专著,乐谱,连续出版物,地图,录音:音频CD、录音:音频CD-R、录音:模拟、录音:卡带,动态图像:蓝光DVD,动态图像:35mm胶片,珍稀资料)
  • Resource Description Framework (RDF) / 资源描述框架
  • Resource Template / 资源模板(BF编辑器的构建块。 资源模板描述与给定配置文件关联的各种资源之一,如:作品、实例、单件、标识符、语种等)
  • Semantic Web / 语义网
  • Stub / 存根(从MARC书目7XX题名生成的BF作品。软件会检查BF文档中是否存在现有作品以建立链接,但如果找不到题名,则软件会使用其所有的(仅题名或作者/题名)做一个非常简短的作品描述。这些在BF数据库中以“来自书目的作品存根”进行标识)
  • Template / 模板(可以对BF配置文件进行个性化修改,以简化资源描述)
  • Triple Statement / 三元组陈述
  • Uniform Resource Identifier (URI )
  • Web of Data / 数据网(“语义网”的松散同义词)
  • Work / 作品
  • Workspace / 工作空间(BF编辑器的区域,可以在其中使用对话框、自由文本字段、菜单、按钮和查找功能来创建BF记录。 此外,“浏览”链接会将您带到保存BF记录的工作区)

附手册目次:

  • Unit 1: Getting Started 入门(BIBFRAME,ILS,BF编辑器)
  • Unit 2: BIBFRAME and Linked Data(关联数据,数据网,RDF,三元组陈述,URI/IRI,词表和本体)
  • Unit 3: Searching(查BF数据库,用BF编辑器查,查LC规范档/LCSH及其他规范)
  • Unit 4: Introduction to ID.LOC.GOV, the Library of Congress Linked Data Service LC关联数据服务导论
  • Unit 5: Templates(创建模板,克隆作品或实例)
  • Unit 6: Creating a New Work and Instance 创建新作品和实例
  • Unit 7: Adding a New Instance to an Existing Work 添加新实例到现存作品
  • Unit 8: Importing Descriptions from the BIBFRAME Database 从BF数据库导入描述
  • Unit 9: Preview and Post 预览和发布
  • Unit 10: Workflows 工作流程
  • Unit 11: Non-Latin Scripts 非拉丁文字
  • Glossary 词汇表
  • Help, Support, and Other Resources(限员工访问网址)

LC发布BIBFRAME到MARC转换

LC在2017年发布了MARC到BIBFRAME转换,包括转换规范、转换程序及转换结果对照查看工具。参见:MARC到BIBFRAME转换:并列比较工具(2017-4-7)

2020年4月底,LC发布了BIBFRAME到MARC转换,同样包括转换规范、转换程序及转换对照查看工具:New BIBFRAME-to-MARC Conversion Tools

BIBFRAME到MARC转换,是已持续多年的BIBFRAME 2.0试验的一部分。转换规范与程序由LC网络开发与MARC标准办公室委托Index Data公司开发,基于MARC到BIBFRAME转换规范,LC方面提供指导。转换规范以EXCEL格式提供,共15个按MARC字段组织的文档。转换程序在LC的Github页面提供。

—— 转换中所用MARC约定 ——

BIBFRAME到MARC转换中,偶尔需要做选择。同时LC在BIBFRAME数据中广泛使用URI,希望避免丢失在MARC描述版本中的URI。因而遵循以下约定。【本人注释】

  • 转换008和007/00和/01,尽管在可以记录其取值的URI时,也同时在格式的其他位置重复。
  • 对数据在MARC中会有多个位置的情况,通常只选择一个。【除以上008、007外,数据不重复】
  • 对MARC允许可选的数据,必须作出选择。例如,对包含非拉丁字母数据的记录,选择模型B【简单多文字记录】而非模型A【原文字+音译】(多文字记录)。因此记录中不使用880字段。非拉丁字母数据将在正常字段出现,较少非拉丁字母数据的音译。【不采用880字段】
  • 对LCSH主题标目,整个字符串的URI在字符串之前,而组成部分的URI在其适用的组成部分之后。
  • 如果在相应的BIBFRAME元素中不带标点,则不会在子字段边界插入标点。【省略ISBD标点】
  • URI放在MARC$0子字段中。【默认为$0(规范记录控制号或标准号)而非$1(RWO真实世界对象URI)】

—— 转换对照查看工具 ——

BIBFRAME到MARC的转换对照查看工具(Compare BIBFRAME back to MARC

MARC到BIBFRAME的转换对照查看工具(Compare MARC converted to BIBFRAME

两者版式与使用方法一致,即通过LCCN或书目记录号查找记录,左侧为来源格式、右侧为目标格式。

目前BIBFRAME到MARC的默认样例是LCCN=2018958785的记录(Bibframe2Marc),看右侧由BIBFRAME转换成的MARC记录,不禁好奇同样记录在MARC到BIBFRAME转换中会是一样的吗(Marc2Bibframe)。比较下来不一样的,见以下由BIBFRAME转换的MARC记录【及本人注释】

     nam a22     5i 4500【头标:17位编码级别5=部分级,此记录为计划出版/CIP记录;18位描述编目规则i= 含ISBD标点,从记录看并未采用ISBD标点,当取c=省略ISBD标点】
001    20674836
003    DLC【原生MARC记录中无003,默认DLC】
005    20180919121044.0
008    180919s2019    nyu   00| |eng |【原生MARC记录中不用“|”而用“0”或空】
010    $a  2018958785
020    $a9781419738074
040    $aDLC$beng$cDLC$eisbd$erda【不知是否因头标18位=i而有$eisbd?在当前编目实践中,即使含ISBD标点,也不用$eisbd】
042    $apcc
100 1  $aLondon, Kaye.$4http://id.loc.gov/vocabulary/relators/ctb【原生MARC记录无责任方式,添加$4“关系”而非RDA编目通用的$e“关系词术语”。MARC21标准的中有一例https://www.loc.gov/marc/bibliographic/bd100.html:100 1#$aBach, Johann Sebastian.$4aut$0(DE-101c)310008891】
245 10 $aCovered in crochet$bstylish crochet projects and ideas to yarn bomb your life$cKaye London ; [edited by] Meredith Clark【子字段末尾没有ISBD标点】
264  1 $ahttp://id.loc.gov/vocabulary/countries/nyu$c2019【增加出版地URI,原生MARC记录无】
264  1 $aNew York, NY$bAbrams$c2019
300    $apages cm【没有页码、尺寸,表明为CIP数据;原生MARC记录有263字段=1909,即计划2019-09出版。经查转换规范,没有263字段】
336    $atext$0http://id.loc.gov/vocabulary/contentTypes/txt【原生MARC记录没有用$0URI,使用$b代码和$2来源】
337    $aunmediated$0http://id.loc.gov/vocabulary/mediaTypes/n【同上】
338    $avolume$0http://id.loc.gov/vocabulary/carriers/nc【同上】
884    $aDLC bibframe2marc v1.0.0 $g20200430171644.0 $qDLC $uhttps://github.com/lcnetdev/bibframe2marc【原生MARC记录没有的字段:884描述转换信息,共5个子字段:$a转换过程,$g转换日期,$q转换机构$uURI,没有使用$k来源元数据标识符】