BIBFRAME工具强化:MARC题名规范记录转换为BIBFRAME作品

LC最近对BIBFRAME工具进行了强化,主要是增加了MARC题名和名称/题名规范记录转换为BIBFRAME作品描述部分,包括3个部分:
1、说明书,链接在“MARC21到BIBFRAME 2.0转换说明书”中:
MARC 21 to BIBFRAME 2.0 Conversion Specifications
Process notes – R2 (Word, 28 KB, 07/27/2017)
MARC Title Authority Conversion Specifications
Authority Info: Name/Title and Title – R0 (Excel, 33 KB, 07/28/2017)
根据使用说明(Usage Notes),上述转换说明书(映射表)省略了不适用于题名规范的MARC字段。对原来的“处理注释”说明书(Process Notes)增补了转换MARC题名规范为BIBFRAME作品所需的注释(见上)。

2、转换程序,放在Github上,marc2bibframe2的with-auths部分:https://github.com/lcnetdev/marc2bibframe2/tree/with-auths

3、对照阅读器:http://id.loc.gov/tools/bibframe/compare-lccn/full-ttl?find=n79132705
就是原来的BIBFRAME比较工具,选择LCCN(而非书目ID),可以看MARC规范记录及转换为BIBFRAME的情况

LC每天使用这些工具开发与调整其BIBFRAME 2.0试验,因此在不断更新纠错中。

via [BIBFRAME] BIBFRAME tools relating to MARC title Authority records / McCallum, Sally. 2017-12-1

RDA到BIBFRAME的映射报告

PCC下属BIBCO(单行出版物)和CONSER(连续性资源)分别提出了各自的“标准记录”到BIBFRAME的映射表,同时两个映射任务组也提交了最终报告,总结映射结论及问题。9月时PCC BIBFRAME任务组曾在PCC邮件组公开征求反馈。

PCC的“标准记录”,实际就是目前的完整级记录,作为RDA应用纲要,有RDA条款(元素)与MARC21字段子字段的映射,最新版目前见各自项目的首页
BIBCO Standard Record (BSR) RDA Metadata Application Profile (September 6, 2017 revision)
CONSER Standard Record (CSR) RDA Metadata Application Profile (September 6, 2017 revision)
参见:BIBCO标准记录(BSR)及解读(2016-3-6)

此次标准记录到BIBFRAME的映射,实际上就是RDA到BIBFRAME的映射,即在原应用纲要(前4项)基础上增加6个栏目,包括:
RDA条款与元素、RDA条款号、注释、MARC字段子字段
RDA-RDF(RDA注册属性)、环境(三元组)、LC BF 2.0(属性)、期望值、任务组对BF2.0注释、问题

BIBCO的映射基于CONSER,报告也基本上认同后者观点,因此看CONSER报告就可以获取绝大部分信息。两个报告目前在PCC首页的“What’s New, Decisions, Policies, and Guidelines”部分。
CONSER报告中看到的几个特别关注点:
1、强调机器可执行性(actionable),这方面RDA和BIBFRAME都有需要改进的地方。内容散见于报告各个部分,如下:
– BIBFRAME的date属性推荐值是文字,我们建议使用机器可执行的“类型文字”
– 建议PCC最佳实践应该在可行的情况下,除当前RDA规则要求的转录数据外,鼓励提供可执行数据(如出版、生产、发行、制作)
– BIBFRAME的连续出版物首期、末期属性期望值是文字……记录为机器可操作数据会强化连续出版物描述信息的可用性
– RDA载体特征变化:数量尺寸变化,以往用附注,关联数据环境中建议再用1个带与日期相关的数量属性
– BIBFRAME中使用RDA注册的取值词表,包括:内容、媒介和载体类型,频率,附注类型,职能(关系说明语),体裁形式(作品形式)
– BIBFRAME用空节点+ISSN作为文字。当ISSN有LOD时,推荐链接到ISSN URI

2、关于FRBR四层WEMI与BIBFRAME三层WII,以及FRBR对连续出版物的适用性(“建模与关系”部分)
BIBFRAME关系属性只比RDA关系说明语省略了2个:augmented by (work),complemented by (work)(报告最后建议BIBFRAME增加)。
顺序关系如先前、后续在FRBR模型中为作品-作品关系,在BIBFRAME模型中仍为作品-作品关系,在BIBFRAME中表达相对简单。
垂直或水平关系(如语言版本、补编、部分)因FRBR作品/内容表达合为BF作品而成为很大挑战。
更大的挑战来自IFLA-LRM,建议每个连续出版物作品只有1个内容表达、1个载体表现,导致连续出版物的每个版本和格式作为1个独特的作品,其关系为作品层关系【!】……如果连续出版物的每个新实例也作为单独作品,作品到实例的属性不再需要……

3、管理元数据
如果已经没有记录结构,(基于记录的)描述级管理元数据在关联数据环境中过时了。

——— CONSER报告摘录 ———
Report to the PCC BIBFRAME Task Group: Final Report of the CONSER CSR to BIBFRAME Mapping Task Group

概要
总的来说, 小组发现BIBFRAME可以容纳描述连续出版物资源所需的信息,主要以静态文本字符串。我们还发现,BIBFRAME提供了比MARC环境更大的潜力来揭示连续出版物之间的关系。然而,我们发现,在我们的讨论中出现了一些常见的问题,包括:考虑描述/著录的变更,表示编号和年代信息,以及解决使用机器可执行的URI和使用静态文本字符串间的矛盾。我们还反复讨论了表达连续出版物间关系的复杂性,并有很多关于FRBR和BIBFRAME模型之间差异的对话, 以及在何种程度上实际的连续出版物符合那些模型。我们认为,BIBFRAME的进一步开发可以解决我们在映射工作中遇到的这些挑战。

对CONSER/PCC的建议
1、建议CONSER探索技术与基础结构相关方法,顺应更改连续出版物描述数据的需求
2、建议PCC馆日期尽可能使用类型文字
3、建议PCC最佳实践鼓励在当前RDA条款要求的转录数据之外,尽可能提供可操作数据
4、建议CONSER和BIBFRAME开发界一起开发共同结构,表达可用于连续出版物描述的各种环境的编号和年代信息
5、对变更书目信息或编号和年代信息,PRESSoo和其他关联数据词表的建模可能更详细或健壮。建议CONSER为此目的探索PRESSoo和其他关联数据词表
6、建议PCC建立工作组,承担继续监控(连续出版物前景)活动
7、建议PCC和BIBFRAME界一起识别必要的管理和起源元数据,开发在断言层简单易用记录的方法与最佳实践
8、建议PCC馆对内容、媒介和载体类型,频率,附注,使用RDA注册的取值词表

对BIBFRAME开发的建议
1、明确建模描述性元素的起始与终止日期
2、同前4
3、同前7
4、增加对应RDA关系 augmented by (work) 和 complemented by (work)的属性

用类表达类型相对于属性的3个优点

BIBFRAME2.0增加了很多类,增加的类中,很大一部分来自原来的属性。参见:BIBFRAME2.0类的变化(2016-5-2)
比如1.0有数十个表示标识符类型的属性(doi、isbn等),2.0只保留了一个通用的标识符属性identifier(改为一对互逆属性identifiedBy / identifies),其他具体标识符类型大都变成了类(bf:Identifier的子类),有些则取消了(比如isbn的子属性isbn10, isbn13)。

属性变为类,用三元组表达有很大不同。以ISBN为例:
BIBFRAME 1.0(bf:isbn 定义域为实例,值域为 bf:Identifier)
<http://bibframe.example.org/5226/i1> bf:isbn “0394856309”
BIBFRAME 2.0(bf:identifiedBy 不限定使用范围,期望值为 bf:Identifier)
<http://bibframe.example.org/5226#Instance> a bf:Instance;
bf:identifiedBy [ a bf:Isbn ;
rdf:value “0394856309” ]

对人类而言,1.0方式直观、易解,2.0方式比较绕。对于机器可能完全不一样。BIBFRAME 2.0 RDF Conventions (2016-4-21) 在“4)类与类型”部分对此有如下解释:
表达类型为类而非属性有若干优点
可重用。以标识符为例。对于BIBFRAME中表达的每个标识符,创建一个bf:Identifier资源。如果创建为一个关联数据资源(赋予URI),则可被BIBFRAME之外获取与重用。用类反映标识符来源意味着会在被用时获知。如果来源仅由BIBFRAME属性传达,则该来源只当在BIBFRAME环境中访问时才获知。
查询效率。表达类型为类通常让数据更易于被查询。例如“查找类型X的东西”,当X是类时比是属性时更简单。
柔性降级。假定在某外部命名空间(ex:)中创建新的附注类型。如果新类型用属性表达,形如:
ex:noteType “note content”
另一方面,如果类型用类表达,形如:
bf:note [ a ex:NoteType ;
rdfs:label “note content” ]
如果接收系统不认识命名空间ex,则在第一种情况中,陈述完全没有意义。在第二种情况中,系统至少能够认识它是一个附注(尽管不知道附注类型)。

【需要说明的是,对于编目员/元数据制作者,只需要知道有哪些类/属性可用于揭示资源,并不需要了解实际的编码方式。那些都交给计算机程序去解决】

关于“BIBFRAME 2.0 RDF Conventions”,另参见:rdf:value和rdfs:label的差别(2016-6-22)