LC目录查BIBFRAME转换记录无果

今年年中看到BIBFRAME更新论坛又讲到“BIBFRAME 100”,即美国国会图书馆(LC)去年有100名编目员、每周2天、以BIBFRAME编目,2021年起改为全部350名编目员、每周5天、以BIBFRAME编目,并且不再做MARC记录,此100仍100%之意。

计算一下:350人*5天*25周/半年=43750人天

假定每人每天做3种,就会有13万条BIBFRAME记录,即使少至1种、也该有4万条以上。

由于LC并未更换系统,因此其目录中的新增记录应该都是由BIBFRAME转换而来的MARC记录。这些记录长什么样?是不是和BIBFRAME到MARC转换界面看到的一样?于是想查一下。

在BIBFRAME到MARC转换中,转换而成的MARC记录中有884字段(2015年新增),形如:

884 $aDLC bibframe2marc v1.1.0-SNAPSHOT $g20210619231058.0 $qDLC $uhttps://github.com/lcnetdev/bibframe2marc

用LC目录的专家搜索查这个特征,是不是可以找出来由BIBFRAME转换而来的记录呢?
于是到LC目录:

一、关键词搜索(专家搜索)Keyword Search (Expert) https://catalog.loc.gov/vwebv/searchKeyword

  • 884A bibframe2marc(Your search could not be processed as entered.)
  • K884 bibframe2marc(Your search could not be processed as entered.)
  • 说明884不可查。

二、再看搜索帮助:Search/Browse Help — Keyword Bibliographic Index Configurations https://catalog.loc.gov/vwebv/ui/en_US/htdocs/help/index_keyword.html

三、是真没有,还是查不到?再试着查2021年或2020年编制的记录(LCCN以2021或2020起始)。

  • 高级搜索,选择途径LCCN:
  • 2021(Your search found no results.)
  • 2020:2条(分别是010=2020,显然有误;010=2020938908)
  • 查其他年份,没有结果——结论:LCCN只能完全一致检索(2020年那条能搜索到的原因不明)

四、再查2021或2020年出版文献(008字段第1出版年),专家搜索:

  • 008D 2021(大多在版编目记录,有263字段计划出版日期)
  • 008D 2020(大多在版编目记录,有263字段计划出版日期;今天查在版编目记录明显减少)
  • 记录005或008字段显示2021年的,均未看到884转换字段。
  • 放弃。

今天与同行讨论此事,想起当初(2021-7-8)所写上述内容,放出。

个人猜测,LC当前的自动化系统在导入由BIBFRAME转换而成的MARC记录时,屏蔽了884字段,导致字段信息丢失?

参见:

LC联机目录的“专家搜索”(2015-10-6)

BIBFRAME/MARC数据双向转换程序更新(880字段消失)(2021-6-20)

884字段:描述转换信息(2015新增)https://www.loc.gov/marc/bibliographic/bd884.html

  • $a – Conversion process (NR) 转换处理(如: DLC bibframe2marc v1.1.0-SNAPSHOT)
  • $g – Conversion date (NR) 转换日期(yyyymmddhhmmss.X,如:20210619231058.0)
  • $k – Identifier of source metadata (NR) 来源元数据标识符
  • $q – Conversion agency (NR) 转换机构
  • $u – Uniform Resource Identifier (R) [转换程序]URI(如:https://github.com/lcnetdev/bibframe2marc)

BIBFRAME本体2.1版发布(4层确认)

美国国会图书馆(LC)赶在BIBFRAME更新论坛于2021/6/29召开前,发布了BIBFRAME本体的2.1版(之前为2.0.1版),涉及50个类与属性的变化。美国国会图书馆网络开发与MARC标准办公室主任Sally McCallum在BIBFRAME邮件组中说明,其中绝大多数来自社区中一直在使用Bibframe词表和模型的实施者,并表示感谢。 见:BIBFRAME Ontology Updated / McCallum, Sally (2021-6-24)

LC网站上有修订后的本体:http://id.loc.gov/ontologies/bibframe。主要讨论场所则在GitHub:https://github.com/lcnetdev/bibframe-ontology

LD4社区应该是所指的重要实施者,BIBFRAME本体中有4个属性(awards、custodialHistory、dimensions、fontSize)在编辑附注中注明“请参阅 ARM Ontology(艺术与珍本资料本体) 以了解更详细地对此信息建模的策略”。【参见:BIBFRAME扩展:bibliotek-o(及ArtFrame和RareMat)(2018-5-1)】

Kevin Ford昨天在BIBFRAME的GitHub中发了上百条评论、包括关闭问题,涉及对建议的处理结果,如在BF中声明FOAF命名空间等,特别有一条解释新增的Hub类。之前在某PPT已经见过Hub,此评论可认为是官方解释。概言之,Hub为作品的子类,对应于RDA作品。也就是说,BIBFRAME对应于LRM/RDA的资源四层结构为:Hub—BF作品—实例—单件

Proposal: New class – bf:Hub #75

bf:Hub 的实验始于三年多前(在 LC),并于2019年6月首次公开实例化[用于实例?]。Hub被定义为作品的子类,是抽象资源,充当两个作品之间的桥梁。通过这种方式,它们起到聚合和配置资源的作用。例如,它们使收集马克吐温的《汤姆·索耶历险记》(Tom Sawyer)的所有西班牙语翻译成为可能,或者捕获包含弗朗西斯科·塔雷加(Francisco Tarrega[西班牙吉他演奏家、作曲家])的《随想曲》(Capricho árabe)的其他BF作品。在LC的实验中,Hub作为聚合器执行三个功能:作为主题、作为相关作品以及作为 RDA 意义上的作品。Hubs,作为BF作品,可以作为主题来描述其他作品。

参见:Hub:BIBFRAME模型下的超级作品(2020-6-28)

—— 附:BIBFRAME 2.1的变化 ——

根据Change Notes总结(红字,日期2021-06-09),共86处修改,有些属性涉及多处修改。

一、新增22个类/属性,大致可分成两部分

(一)类(7个)及相应属性(6个)

  • AccessionNumber(登录号,标识符Identifier子类)
  • CollectionArrangement(资料信息的组织)collectionArrangement(资源集合的组织安排)/ collectionArrangementOf,collectionOrganization(资源分成较小单元的方式)
  • Eidr(Entertainment Identifier Registry,标识符Identifier子类)
  • Ensemble(合奏,新增上位类:有子类MusicEnsemble)
  • Hub(中转站/枢纽=桥接两个作品的抽象资源,作品Work子类)
  • Material(材料=资源的物质或组成,新增上位类:有子类BaseMaterial、AppliedMaterial)material(有子属性baseMaterial、appliedMaterial)/ materialOf(有子属性baseMaterialOf、appliedMaterialOf)
  • PubFrequency(资源的出版频率)pubFrequency

(二)原有属性的互逆属性(9个)

adminMetadataFor,agentOf,appliedMaterialOf,arrangementOf,baseMaterialOf,contributionOf,noteFor,subjectOf,titleOf

二、其他修改

  • 1、因新增上位类导致的变化(AppliedMaterial、BaseMaterial、MusicEnsemble;appliedMaterial、baseMaterial、ensemble、ensembleType)
  • 2、修改标签(MovementNotation、MusicNotation、Script、TactileNotation、mount)
  • 3、修改定义(Arrangement、Event、GenreForm、Mount、Urn;arrangement、ensemble、expressionOf、hasExpression、originDate、originPlace、relatedTo)
  • 4、修改/增加附注(Classification、Identifier、Note;awards、custodialHistory、dimensions、fontSize)
  • 5、修改Comment(hasPart、partOf:也用于Event)
  • 6、修改上位属性(otherEdition)
  • 【以下定义域/值域的修改基本上是为减少对使用的限制】
  • 7、扩大定义域/用于(appliedMaterial、assigner、baseMaterial、issuedWith、otherPhysicalFormat、subject、title)
  • 8、移除定义域/用于所有资源(electronicLocator、firstIssue、frequency、geographicCoverage、lastIssue)
  • 9、扩大值域/期望值(colorContent、extent)
  • 10、移除值域/期望值为所有资源或取值(acquisitionSource、agent、appliedMaterial、assigner、baseMaterial、derivedFrom、descriptionModifier、genreForm、grantingInstitution、heldBy、issuedWith、originPlace、place、source)
  • 11、修改值域(hierarchicalLevel、pattern)

美国实施新RDA:不早于2022年7月

测试版RDA工具包已在2020-12-15如期切换为官方版(新RDA)。LC于12-18发布信息,表示其项目团队已完成7500多条的政策声明(LC/PCC-PS)草案【可怕的工作量】。PS目前仍有待审查、修订和测试,将在新RDA发布后首次升级(预计2021-4-5)之后,再接受各方评论。

政策声明只是转换实施新RDA的起点,还需要完成另二种配套文件:1)PCC应用配置文件,2)PCC RDA元数据文档。

10月底PCC政策委员会会议确定,不早于2022年7月实施,会议成果(PoCo 2020 Meeting Outcomes, 2020/10/28-30)涉及新RDA进展部分如下:

  • 决定:PCC实施新RDA的日期不早于2022年7月;LC和PCC将尽可能协调其实施。
  • 行动:PCC主席将向PCC讨论邮件组发送消息,重申在2020年12月15日发布新RDA时,不应在PCC记录中使用新RDA,并宣布预计实施日期不得早于2022年7月;稍后将发送更详细的消息。可能会有一个实施过渡期。
  • 决定:与新RDA有关的LC-PCC文档将统称为“ PCC RDA元数据文档”。
  • 决定:将为MARC和BibFrame描述创建新RDA培训材料。
  • 决定:PCC将在实施前对新RDA进行测试,大概需要2个月。在开始测试之前,应完成PCC RDA元数据文档。
  • 行动:PCC秘书处将讨论可能解除对新的非渠道PCC成员的禁令。【?】

成果中还有3份相关文件链接:

  • LC-PCC政策声明进简述展(Brief update on LC-PCC Policy Statements)
  • 政策委员会讨论:新RDA实施计划( PoCo Discussion: Plans for New RDA Implementation)
  • RDA测试版实施时间表(Timeline for RDA Beta Implementation)


最后这份即《新RDA工具包实施》(Implementation of the New RDA Toolkit, 2020/11/04),有2021/1-2022/6分季度时间表(各种文档准备与测试),2022年7月开始培训编目人员……【实际实施不知何时】

实施准备中有多处提及BIBFRAME,尤其引人注意的是“LC希望使用BIBFRAME编辑器实施RDA,因此不会对员工进行在MARC环境中应用RDA工具包的培训”,可见LC要在转换到BIBFRAME以后再实施新RDA——换言之,BIBFRAME实施已为期不远

看来新RDA要加快BIBFRAME映射工作了(目前各“元素参考”部分仅有LRM和MARC映射)。

欧洲各国实施新RDA计划参见:2020年“RDA在欧洲”虚拟会议:从头开(2020-10-13)