2024夏BIBFRAME更新论坛

今夏BIBFRAME更新论坛于2024-7-1举行,视频及PPT已上线。与1月论坛一样,这次也只有2个报告,其中一个还是美国国会图书馆(LC)自己的。

参见:2024冬BIBFRAME更新论坛(2024-2-8)

BIBFRAME July 2024 Update Forum. https://www.loc.gov/bibframe/news/bibframe-update-jul2024.html

  • 开场中Sally McCallum首先介绍了LC的最近活动

[1] 发布MARC到BIBFRAME和BIBFRAME到MARC转换的更新(2.6版)。包含改进的标题和管理元数据的$1URI转换。【规范检索点加$1……见:说明文件

[2] 在接下来的几个月里,一些LC编目员将开始在我们的BIBFRAME系统中编目,他们创建的记录将由系统转换为MARC,而不是在MARC中对记录进行双重键入【终于正式开始了】。这些记录的一些特征将通过从BIBFRAME转换进入我们的MARC 文件……。将在下周发布对它们的描述——但没有什么太大的惊喜:更多URI在$1、更多使用3XX字段等。我们随意地称其为“现代 MARC”(Modern MARC),因为我们更多地利用了自2008年以来建立的MARC字段,主要是为了适应RDA。

  • LC的报告:ScriptShifter:增强图书馆元数据和发现(ScriptShifter: Enhancing Library Metadata and Discovery / Paul Frank and Matt Miller)

ScriptShifter是LC新开发的、开源的罗马化音译工具——多种文字与拉丁字母间相互转换。【以往编目时,对非拉丁文字需要音译成拉丁字母……(将另写博文)】

在线使用:https://bibframe.org/scriptshifter

也可本地运行、本机运行、通过API集成到其他软件中使用:

[1]在GitHub上运行基于Python的开源工具,源代码:https://github.com/lcnetdev/scriptshifter/

[2]运行在Docker hub上找到的工具的打包Docker镜像:https://hub.docker.com/r/lcnetdev/scriptshifter/tags

[3]使用内置web应用程序或查阅API文档:https://github.com/lcnetdev/scriptshifter/blob/main/doc/rest_api.md

  • 外部机构的报告,来自Share Family(Share-VDE),Sally McCallum称是“第一个对BIBFRAME做出重大承诺的系统”:促进BIBFRAME协作:与Share Family的互操作性和数据管理(Fostering BIBFRAME collaboration: interoperability and data curation with the Share Family / Tizianna Possemato, Casalini Libri – @Cult)

报告以多种图示介绍Share Family背景:包含的项目,2016-2024发展时间线。

Share Family的数据处理和输出,特别是Sapientia集群知识库(CKB)和 JCricket实体编辑器;CKB中深度粒度化,包括数据分组。

最后是LC最关注的互操作——强调在Share-VDE本体中包含bf:Hub,保证互操作

Share Family(Share-VDE)近年在图书馆关联数据领域很活跃,部分相关博文可参见:

BIBFRAME作品与实例的子类(及与RDA/MARC21的对照)

写上篇博文“如何查各类BIBFRAME记录(及作品和实例子类的表示)”/posts/2024/0611/6256】时得知在BIBFRAME中档案是实例的子类。印象中RDA没有“档案”这一类。

查RDA,“档案”使用术语 archival resource(档案资源),是一个文献(类型),但不属内容类型或媒介类型。于是想给RDA与BIBFRAME的文献类型作个对照。

RDA遵循FRBR/LRM模型,资源的四层实体为“作品W-内容表达E-载体表现M-单件I”。BIBFRAME(以下简称BF)只有三层实体“作品W-实例I-单件I”,其中BF作品对应RDA的作品和内容表达。

从本体(词表)看,BF类(实体)多、几乎与属性的数量相当。而RDA类(实体)很少,但有内容类型对应于内容表达,有媒介类型对应于载体表现。因此直觉BF作品子类可对应RDA内容类型,BF实例子类可对应RDA媒介类型。但初步对比表明,事实并非如此。我甚至找出AACR2章节和MARC21头标和008、007字段来做对照,试图找出BF作品/实例子类的依据或来源。

首先,BF实例子类与RDA媒介类型差别很大,只有缩微和电子(计算机)2个相同

BIBFRAME实例子类
Print
Archival【RDA无档案】
Tactile【RDA内容类型中细化触觉】
Electronic
Microform
RDA媒介类型
audio【BF作品子类】
computer
microform
microscopic【BF无显微,新增】
projected【BF无投影】
stereographic【BF无立体】
unmediated【含BF的Print+Tactile】
video【BF作品子类有MovingImage】

仔细想想,BF实例的5个子类,都可能包含多种内容类型,如印刷品,可能含文字、地图、图像、乐谱、舞谱、手稿等等(缩微同);档案还能包含音视频、电子资源等更多内容类型。也就是说,我当初认为的其与RDA媒介类型对应的想法根本不对路。

其次,RDA的内容类型是多种内容类型的组合,如cartographic tactile image(含地图、触觉、图像)。而BF的作品子类包含2个方面:内容类型和组织形式(RDA术语“扩展计划”extension plan)。作为MARC21的替代,BF作品子类与MARC21头标06位记录类型(内容类型)和07位书目级别(RDA扩展计划)的对应更好(下表BF作品子类后的标记=MARC21头标取值)。

BIBFRAME作品子类
Text=06a
Cartography=06e
Audio=06ij
NotatedMusic=06c
NotatedMovement【新增】
Dataset=06m【细分】StillImage=06k
MovingImage=06g
Object=06r
Multimedia=06m【细分】
MixedMaterial=06p
Manuscript=06dft【RDA无手稿】

Collection=07c
Arrangement【无对应】
Integrating=07i
Monograph=07m
Serial=07s
Series【无对应】
RDA内容类型
cartographic dataset
cartographic image
cartographic moving image
cartographic tactile image
cartographic tactile three-dimensional form
cartographic three-dimensional form
computer dataset
computer program
notated movement
notated music
performed movement【BF无专指类/属性】
performed music【BF属性】
sounds
spoken word
still image
tactile image
tactile notated movement
tactile notated music
tactile text
tactile three-dimensional form
text
three-dimensional form
three-dimensional moving image
two-dimensional moving image

RDA扩展计划
integrating determinate plan
integrating indeterminate plan
static plan
successive determinate plan
successive indeterminate plan
MARC21/Leader
06 – Type of record
a – Language material
c – Notated music
d – Manuscript notated music
e – Cartographic material
f – Manuscript cartographic material
g – Projected medium
i – Nonmusical sound recording
j – Musical sound recording
k – Two-dimensional nonprojectable graphic
m – Computer file
o – Kit【BF无套件】
p – Mixed materials
r – Three-dimensional artifact or naturally occurring object
t – Manuscript language material

MARC21/Leader
07 – Bibliographic level
a – Monographic component part
b – Serial component part
c – Collectiond – Subunit
i – Integrating resource
m – Monograph/Item
s – Serial

与RDA相关的备注:

  • 1)archival resource 档案资源,是一个文献(类型)。多个元素有档案相关规定,如:作品属性:system of organization;载体表现属性:date of production,title of manifestation。
  • 2)manuscript 手稿:RDA术语表中没有“手稿”,但在一些作品、内容表达或单件元素中有相关规定
  • 3)series丛编:RDA有多个丛编相关元素,为载体表现元素
  • 4)print 印画:print特指印刷图片如版画,而不是BM实例子类所指广义的印刷品——RDA术语常很特别(比如unmediated 无中介)。

如何查各类BIBFRAME记录(及作品和实例子类的表示)

有同行想找使用bf:Archival的例子,但没有找到,在BIBFRAME邮件组寻求帮助。

美国国会图书馆(LC)负责BIBFRAME的网络开发与MARC标准办公室的Nate Trail首先给出的解答是:档案(bf:Archival)是实例(bf:Instance)的一个类型(rdftype),因此在id.loc.gov上查实例会看到更多。

按Nate给出的实例检索式(https://id.loc.gov/search/?q=cs:http://id.loc.gov/resources/instances,侧栏细化检索有类型分面,目前Archival有1025条。【此法对查找不同类型记录特别方便,如修改为作品检索式(https://id.loc.gov/search/?q=cs:http://id.loc.gov/resources/works,再由侧栏分面细化限定】

然而,实例中并未使用bf:Archival。BIBFRAME词表网站的Archival类(https://id.loc.gov/ontologies/bibframe.html#c_Archival)的示例,也没有直接使用bf:Archival。

Nate后来解释:对作品和实例类型,LC不使用子类作为资源的名称(如bf:Archival),而是保留bf:Instance,用一个rdf:type属性进一步定义它。如BIBFRAME词表网站中的示例片断【特别是第2行】:

<bf:Instance rdf:about=http://id.loc.gov/resources/instances/5811340>【bf:Instance类】
    <rdf:type rdf:resource=http://id.loc.gov/ontologies/bibframe/Archival/>【子类Archival】
    <bf:title >
      <bf:Title >
        <bf:mainTitle >Benjamin Silliman correspondence</bf:mainTitle>
      </bf:Title>
    </bf:title>
…
</bf:Instance>