BIBFRAME本体2.4版及MARC转换2.7版发布

近日LC网络开发与标准办公室主任Sally McCallum在BIBFRAME邮件组发布信息,BIBFRAME词表2.4及BIBFRAME-MARC双向转换2.7发布。奇怪的是,邮件标题只提转换不提词表(BIBFRAME/MARC conversion update 2.7. https://listserv.loc.gov/cgi-bin/wa?A2=BIBFRAME;a5601218.2409)。找出新版词表和转换的更新内容对照着看,理解到,词表是为MARC字段转换为BIBFRAME而更新,另外还有一些转换更新不涉及词表变化;而BIBFRAME到MARC反向转换主要是相应变化。

2024年7月初BIBFRAME更新论坛,介绍的是BIBFRAME-MARC双向转换2.6。7月中我准备上海图书馆采编中心讲座PPT时,无意发现已更新到2.7(增加758字段作品和实例URI)。但当时不知道词表(本体)也已更新到2.4。目前BIBFRAME网站的新闻也还没有相关信息。

参见:上图讲座:美国国会图书馆实施BIBFRAME(附历年PPT分享)(2024-8-29)/posts/2024/0829/6293

BIBFRAME 2 Ontology——BIBFRAME 2 List View. https://id.loc.gov/ontologies/bibframe.html

词表/本体2.4版更新于 2024-07-10,共16处变化(新增11、其中8之前为bflc,修改5),可归为4组(新增3,修改1):

注:GH为更新问题讨论,链接网址构成方式类似,如GH119,网址为 https://github.com/lcnetdev/bibframe-ontology/issues/119

一、分类号、标识号(类,新增)

  • bf:ClassificationNal,美国国家农业图书馆分类法,bf:Classification子类。(GH119)【MARC 070】
  • bf:OclcNumber,OCLC号,bf:Identifier子类。(GH120)【MARC 035,OCLC号原定义域:bf:Local】

二、关系(类与属性,新增 (GH116))【代替BIBFRAME的LC扩展 bflc:】

  • bf:Relation,关系(关联资源及其与所描述资源的关系)【代替bflc:Relationship】
  • bf:relation,关系【代替bflc:relationship】
  • bf:Relationship,关系类型(资源之间的关系类型)【代替bflc:Relation】
  • bf:relationship,关系类型【代替bflc:relation】
  • bf:associatedResource,关联资源【新增,GH116中为:bf:relatedResource?】

三、出版相关(属性,新增(GH124))【代替BIBFRAME相应的LC扩展 bflc:】

  • bf:distributionStatement,发行说明(通常转录)
  • bf:manufactureStatement,生产说明(通常转录)
  • bf:productionStatement,制造说明(通常转录)
  • bf:publicationStatement,出版说明(通常转录)

四、丛编(属性,更新定义或定义域)【进一步改进490字段创建丛编Hub】

  • bf:hasSeries,有丛编(资源与其发布所在的较大资源之间的关系;组成部分上含较大资源的题名)
  • bf:seriesOf,丛编(较大资源与其包含的资源之间的关系,形成一个丛编,较大资源的题名出现在组成部分上)
  • bf:hasSubseries,有子丛编(资源与其发布所在的较大丛编资源之间的关系;较大的丛编资源是另一个总体丛编资源的一部分)
  • bf:subseriesOf,子丛编(丛编资源与其包含的资源之间的关系,形成子丛编;丛编资源本身与更大的资源有关系,它是其中的组成部分)
  • bf:seriesEnumeration,丛编数量(通常转录)。更新定义域 (GH100)【由Instance扩大为:Work或Instance】

上述“关系”的变化,被称为“新的关系构造”,(以间接关系)反映现有的[RDA]行为者的贡献角色建模,影响到众多MARC字段转换,如7XX$i,760-788关联款目。另外,记录中如果没有240,7XX$t等将作为240创建Hub;对041字段中的语言资源,根据每个子字段中的信息创建特定语言的注释或特定语言的伴随资源。这些信息的揭示及丛编相关属性的更新,应该能有效地改善BIBFRAME对作品和Hub的聚类。

参见:Bibframe Hub 聚类现状(2024-9-16)/posts/2024/0916/6303

— 附:BIBFRAME词表及转换相关博文 —

目前的BIBFRAME 2词表,发布于2016年,自2021年起每年更新一版,是为2.0(2016-04-21)2.1(2021-06-09)2.2(2022-10-03)2.3(2023-11-30)和2.4(2024-7-10)。

MARC到BIBFRAME转换发布于2017年,BIBFRAME到MARC转换发布于2020年。更新频率高于词表,目前大致一年2版(2024年为2.6和2.7版)。

Bibframe Hub 聚类现状

BIBFRAME词表中,Hub的定义是:作为两部作品之间桥梁的抽象资源。

BIBFRAME 2.0最初是三层模型,即“作品 Work—实例 Instance—单件 Item”。相对于《书目记录的功能需求》(FRBR)的四层模型WEMI(作品W—内容表达E—载体表现M—单件I),bf:Work对应于WEMI前两层“作品W”和“内容表达E”。BIBFRAME词表后续更新,2.1版引入bf:Hub,大致对应WEMI最上层的“作品W”,但当时bf:Hub被定义为bf:Work的子类;2.3版将bf:Hub定义为基本模型类(Basic Model Class),可以认为真正与FRBR的“作品”对应,即BIBFRAME 2模型与WEMI模型基本达成一致。参见:

模型如此,数据则是另一回事。因为当初编目时并没有这样一个模型,数据没有相应的标识,现在要运用此一模型,需要通过算法对现有数据进行聚类处理,而算法如果没有适当的数据支撑,也是无法完成正确聚类的。就美国国会图书馆(LC)目前发布的BIBFRAME数据来看,bf:Work(=内容表达E)聚类还有差距,比如一些显然多次出版的作品的相同内容表达却都只有1个实例;bf:Hub(=作品W)差得更远,比如作品的不同语言翻译目前都视为不同bf:Hub。

日前有人在BIBFRAME邮件组提问,说自己原以为在BIBFRAME 2.0中,同一作品的多个翻译会放在一个Hub下,但从LC的BIBFRAME数据看并非如此(如作品《哈利·波特与阿兹卡班的囚徒》)。

LC网络开发和MARC标准办公室的Nate Trail回复,认可她的观点,并举《哈利·波特与阿兹卡班的囚徒》的Hub(Harry Potter and the prisoner of Azkaban,https://id.loc.gov/resources/hubs/7571ef89-f950-64a5-9a78-608b1bfdce54.html),说明bf:Hub数据来自LC相应的名称-题名规范记录(Rowling, J. K. Harry Potter and the prisoner of Azkaban,https://id.loc.gov/authorities/names/no2013059078.html),其中Hub侧栏的分面“related work” 来自规范记录(字段“Additional Related Forms”),其余分面的链接则由记录相关信息动态生成。Nate Trail认为LC需要“调整sparql查询中的一些内容,以优化事物之间的关联方式”

相信随着算法改进,Bibframe Hub和Bibframe Work会有更好的聚集作用。

以下以罗琳“哈利·波特”系列作品(清单附后)第3部《哈利·波特与阿兹卡班的囚徒》为例,记录Bibframe Hub在2024-9-15的聚类现状。

Bibframe Hub:Harry Potter and the prisoner of Azkaban

《哈利·波特与阿兹卡班的囚徒》的Bibframe Hub,侧栏分面有6种,记录了改编电影,以及和“哈利·波特”系列中的前后作品,比系列中其他几种书揭示的内容更丰富:

  • [1] Has Expression(有内容表达,取值为 bf:Work)

Rowling, J. K. Harry Potter and the prisoner of Azkaban

…… [名称相同的其他5条,略]

(说明)名称相同的6条是不同的Bibframe Work。

第1条,是相应的Bibframe Workhttps://id.loc.gov/resources/works/21268504.html,有分面“Translation”(其他5条没有此分面),下列数十条翻译,如:Rowling, J. K. Harry Potter and the prisoner of Azkaban. Slovak(斯洛伐克语),链接的是Bibframe Hub——也就是说,不同语言翻译是不同Hub(即前引邮件组中提出的问题)。

上述6条Bibframe Work记录的侧栏分面详简各不相同,共同的是必有的“Has Instance”(有实例,取值为 bf:Instance),但其下均只有1条Bibframe Instance(如前述不合理之点)。

  • [2] Related To(相关,取值为 bf:Work)

Rowling, J. K. Harry Potter and the Chamber of Secrets

Rowling, J. K. Harry Potter and the goblet of fire

Harry Potter and the prisoner of Azkaban

(说明)信息当来自[3],不同的是链接到相应的Bibframe Work。

  • [3] related work(相关作品,取值为 bf:Hub)

Rowling, J. K. Harry Potter and the Chamber of Secrets

Rowling, J. K. Harry Potter and the goblet of fire

Harry Potter and the prisoner of Azkaban (Motion picture)

(说明)如前引Nate Trail所述,来自规范记录,链接到相应的Bibframe Hub。

  • [4]Sequel to(续前,取值为 bf:Hub)

Rowling, J. K. Harry Potter and the Chamber of Secrets

(说明)“哈利·波特”系列系列第2部

  • [5] Sequel(后续,取值为 bf:Hub)

Rowling, J. K. Harry Potter and the goblet of fire

(说明)“哈利·波特”系列系列第4部

  • [6] Adapted as motion picture(改编为电影,取值为 bf:Hub)

Harry Potter and the prisoner of Azkaban (Motion picture )

(说明)小说改编为电影,是不同作品,有不同bf:Hub(与WEMI模型一致)

附:JK 罗琳的“哈利·波特”系列

  • 1哈利·波特与魔法石 Harry Potter and the philosopher’s stone
  • 2哈利·波特与密室 Rowling, J. K. Harry Potter and the Chamber of Secrets
  • 3哈利·波特与阿兹卡班的囚徒 Harry Potter and the prisoner of Azkaban
  • 4哈利·波特与火焰杯 Harry Potter and the goblet of fire
  • 5哈利·波特与凤凰社 Harry Potter and the Order of the Phoenix
  • 6哈利·波特与“混血王子” Harry Potter and the Half-Blood Prince
  • 7哈利·波特与死亡圣器 Harry Potter and the Deathly Hallows

上图讲座:美国国会图书馆实施BIBFRAME(附历年PPT分享)

昨天在上海图书馆采编中心做了一个讲座,标题《美国国会图书馆(LC)实施BIBFRAME》(PPT链接附后)。

此事源于年初,采编中心纪主任说在做年度学术计划,想请我做堂讲座,主题为编目发展趋势或者大语言模型相关新技术发展等都可以。我答应了,但坦言还没什么想法。之后一直关注两方面进展。

人工智能很热(也写了几篇介绍博文 https://catwizard.net/posts/tag/ai),但刚起步,没有太多实际应用,基本上还处在设想与规划阶段,比如《PCC人工智能和机器学习战略规划任务组最终报告》(2024-4-15)。编目工作或标准方面则没有什么方向性的变化,最大的期待应该就是美国国会图书馆(LC)明年更换图书馆自动化系统FOLIO后实施BIBFRAME了。

7月1日的BIBFRAME更新论坛透露了一些重要信息,顺藤摸瓜看了些资料,也写了些博文。那天去上图听周小玲讲座(听周小玲讲座:RDA的发展和更新(实施与翻译),2024-7-17),和纪主任沟通后,确定了讲座主题。

历年PPT分享

2008年时注册了Slideshare.net,自己的PPT基本上都上传到那里。2018年时忽然要架梯才能访问了,感觉太不方便,就找了academia.edu作为替代。上传了当年的3个文档,主要给博文做链接。之后好像不是每次有PPT都会写博文,有时主办方也会分享PPT,因此没再上传过文档。

昨天讲座后,想着还是可以分享下PPT。于是今天回到academia.edu,索性把2018年以来的PPT大致都上传了。

再说Slideshare.net在2020年被LinkedIn卖给了scribd.com,目前架梯后仍可访问、上传的PPT也都在,但不知道为什么在搜索框中输入题名基本上查不到。直接访问个人主页还是可以看到。