RDA到BIBFRAME的映射报告

PCC下属BIBCO(单行出版物)和CONSER(连续性资源)分别提出了各自的“标准记录”到BIBFRAME的映射表,同时两个映射任务组也提交了最终报告,总结映射结论及问题。9月时PCC BIBFRAME任务组曾在PCC邮件组公开征求反馈。

PCC的“标准记录”,实际就是目前的完整级记录,作为RDA应用纲要,有RDA条款(元素)与MARC21字段子字段的映射,最新版目前见各自项目的首页
BIBCO Standard Record (BSR) RDA Metadata Application Profile (September 6, 2017 revision)
CONSER Standard Record (CSR) RDA Metadata Application Profile (September 6, 2017 revision)
参见:BIBCO标准记录(BSR)及解读(2016-3-6)

此次标准记录到BIBFRAME的映射,实际上就是RDA到BIBFRAME的映射,即在原应用纲要(前4项)基础上增加6个栏目,包括:
RDA条款与元素、RDA条款号、注释、MARC字段子字段
RDA-RDF(RDA注册属性)、环境(三元组)、LC BF 2.0(属性)、期望值、任务组对BF2.0注释、问题

BIBCO的映射基于CONSER,报告也基本上认同后者观点,因此看CONSER报告就可以获取绝大部分信息。两个报告目前在PCC首页的“What’s New, Decisions, Policies, and Guidelines”部分。
CONSER报告中看到的几个特别关注点:
1、强调机器可执行性(actionable),这方面RDA和BIBFRAME都有需要改进的地方。内容散见于报告各个部分,如下:
– BIBFRAME的date属性推荐值是文字,我们建议使用机器可执行的“类型文字”
– 建议PCC最佳实践应该在可行的情况下,除当前RDA规则要求的转录数据外,鼓励提供可执行数据(如出版、生产、发行、制作)
– BIBFRAME的连续出版物首期、末期属性期望值是文字……记录为机器可操作数据会强化连续出版物描述信息的可用性
– RDA载体特征变化:数量尺寸变化,以往用附注,关联数据环境中建议再用1个带与日期相关的数量属性
– BIBFRAME中使用RDA注册的取值词表,包括:内容、媒介和载体类型,频率,附注类型,职能(关系说明语),体裁形式(作品形式)
– BIBFRAME用空节点+ISSN作为文字。当ISSN有LOD时,推荐链接到ISSN URI

2、关于FRBR四层WEMI与BIBFRAME三层WII,以及FRBR对连续出版物的适用性(“建模与关系”部分)
BIBFRAME关系属性只比RDA关系说明语省略了2个:augmented by (work),complemented by (work)(报告最后建议BIBFRAME增加)。
顺序关系如先前、后续在FRBR模型中为作品-作品关系,在BIBFRAME模型中仍为作品-作品关系,在BIBFRAME中表达相对简单。
垂直或水平关系(如语言版本、补编、部分)因FRBR作品/内容表达合为BF作品而成为很大挑战。
更大的挑战来自IFLA-LRM,建议每个连续出版物作品只有1个内容表达、1个载体表现,导致连续出版物的每个版本和格式作为1个独特的作品,其关系为作品层关系【!】……如果连续出版物的每个新实例也作为单独作品,作品到实例的属性不再需要……

3、管理元数据
如果已经没有记录结构,(基于记录的)描述级管理元数据在关联数据环境中过时了。

——— CONSER报告摘录 ———
Report to the PCC BIBFRAME Task Group: Final Report of the CONSER CSR to BIBFRAME Mapping Task Group

概要
总的来说, 小组发现BIBFRAME可以容纳描述连续出版物资源所需的信息,主要以静态文本字符串。我们还发现,BIBFRAME提供了比MARC环境更大的潜力来揭示连续出版物之间的关系。然而,我们发现,在我们的讨论中出现了一些常见的问题,包括:考虑描述/著录的变更,表示编号和年代信息,以及解决使用机器可执行的URI和使用静态文本字符串间的矛盾。我们还反复讨论了表达连续出版物间关系的复杂性,并有很多关于FRBR和BIBFRAME模型之间差异的对话, 以及在何种程度上实际的连续出版物符合那些模型。我们认为,BIBFRAME的进一步开发可以解决我们在映射工作中遇到的这些挑战。

对CONSER/PCC的建议
1、建议CONSER探索技术与基础结构相关方法,顺应更改连续出版物描述数据的需求
2、建议PCC馆日期尽可能使用类型文字
3、建议PCC最佳实践鼓励在当前RDA条款要求的转录数据之外,尽可能提供可操作数据
4、建议CONSER和BIBFRAME开发界一起开发共同结构,表达可用于连续出版物描述的各种环境的编号和年代信息
5、对变更书目信息或编号和年代信息,PRESSoo和其他关联数据词表的建模可能更详细或健壮。建议CONSER为此目的探索PRESSoo和其他关联数据词表
6、建议PCC建立工作组,承担继续监控(连续出版物前景)活动
7、建议PCC和BIBFRAME界一起识别必要的管理和起源元数据,开发在断言层简单易用记录的方法与最佳实践
8、建议PCC馆对内容、媒介和载体类型,频率,附注,使用RDA注册的取值词表

对BIBFRAME开发的建议
1、明确建模描述性元素的起始与终止日期
2、同前4
3、同前7
4、增加对应RDA关系 augmented by (work) 和 complemented by (work)的属性

[RDA记录样例] 按需印刷品:PCC的POD规定

RDA关于摹真和复制品的规则很简单:
RDA 1.11 摹真与复制:著录摹真和复制品时,在适当元素中记录与摹真或复制品有关的数据。适当记录与原始载体表现相关的任何数据为相关作品或相关载体表现。
也就是说,应当按摹真或复制品本身著录,所依据的原本只能作为相关资源。

尽管RDA 1.11没有交替规则,仍有三家设置了本地政策(美国LC-PCC、德语国家D-A-CH、加拿大LAC)。LC-PCC的政策分别对缩微、按需印刷复制品和影印件(Print on Demand (POD) Reproductions and Photocopies)作出了规定。本博文只论后者。
在LC-PCC PS 1.11“摹真与复制”中,PCC对POD采用的方法是“provider-neutral”(提供者中立),或者说不考虑提供者:同一原始载体表现的所有POD制品只做一条记录(比如图书A的影印本,和图书A数字化副本的HathiTrust的POD复制品)。

具体字段说明如下(* 为记录POD特征字段):
008/06:日期类型不使用 r 重印
008/07-10, 11-14:记录原印刷资源的日期
008/15-17:记录原印刷资源的出版地代码
* 008/23(图书) | 008/29(地图):记录单件形式(Form of item)为 r,表明是印刷复制品【MARC标准网站尚无此值】
* 020:如果商业POD服务提供者提供ISBN,记录在$a;原资源如果有ISBN,记录在$z;限定信息入$q。必要时重复020字段。
* 037:如果需要,记录商业POD服务提供者为采购来源。必要时重复037字段。
* 040:$e pn,代码表示提供者中立(provider neutral)【著录规则来源代码显示,此代码原为电子资源设置】。$e可重复,如果符合RDA标准,可同时做 $e rda
245-300:按原印刷资源提供所有载体表现元素如题名、版本说明、出版说明、资源数量等
* 33X:记录适用于复制品的内容类型、媒介类型和载体类型 ,无论采用什么编目规则(即AACR2记录也需提供)
* 533:创建单个复制附注,内容为:$a Print reproduction.
* 775/776 相关载体表现(可选):记录复制品与原件关系,使用775字段(物理格式相同)或776字段(物理格式不同,如PDF与打印件)。$i 使用关系说明语如:Reproduction of (manifestation): ,或者非结构化的其他关系信息如:Print version.

由上可知,PCC的规定也是按照复制品著录、原件作为相关资源著录在775/776字段,与RDA条款似不冲突。但是,此规定在生产出版发行制作说明上完全不考虑POD。由于按需印刷并不修改内容,今年印和明年印是一样的,所以这个规定是合理的,对于合作编目尤其如此。
如果同一原始资源,由不同POD服务提供者制作,该如何处理?从以上字段说明看,重复037及020字段即可。

说明:本规定所指的“按需印刷复制品”与“影印件”都是在提出要求后印制、与原件相同的复制品(包括文本材料、乐谱、地图),无论是内部制作还是向服务提供者订购。差别仅在于前者通常由数字文件打印,而后者通常由实物文献复印。
此法不适合一般的印刷出版、再版、重印、摹真复制等或者缩微复制(如国内较常见的授权影印书不在此列)。
特别注意:当不确定时,不采用此政策。(现在有些专门从事电子书打印的出版社,其出版物是否也应参照POD做,值得考虑)

另外,在LC-PCC PS 1.11“摹真与复制”的最后,也提供了非PCC的交替做法(应该是完全符合RDA条款的做法):基于复制品的著录
机构如愿意基于照相复印、缩微复制或POD复制本身进行著录(而非原件),可以这样做,但这种记录不应当在MARC字段042标记为pcc。同时,原始资源细节可放在MARC字段534。

PCC 2015-2017战略规划

PCC(Program for Cooperative Cataloging,合作编目项目)是美国重要的合作编目项目,包括专著、连续出版物、名称规范、主题规范4个子项目 (BIBCO、CONSER、NACO、SACO)。原以为它与OCLC差不多古老(明年50周年),其实它成立于1994年,比国内主要联编机构早不了几年。
PCC网站在美国国会图书馆网站下,现在成员已不限于北美而成为国际性合作编目组织。作为以“贡献”为主的项目,参与机构共900多家,数量上无法与“共享”为主的OCLC相比,但强烈的使命感是其重要特征。
PCC 2015-2017年战略规范,显示(美国)编目界正为应对信息技术环境的改变做着实实在在的准备。三年行动计划中,4个战略方向共14个行动,为应对特定任务而准备(或已经)成立4个工作小组、1个咨询委员会,每个行动都规定了承担的委员会与时间表。以下仅录对“行动”的描述,可了解其具体动向,而愿景、使命及战略方向的描述则从略【方括号中为本人添加】。

——— PCC 2015-2017战略规划:愿景、使命和战略方向 ———
Vision, Mission, and Strategic Directions: January 2015-December 2017 (Revised: November 20, 2015)

战略方向1:开发课程,推进社群理解关联数据(2个行动)
1.1 执行环境扫描以评价:所需关联数据培训的类别;PCC可以使用的现有培训资源;应该委托本领域专家的培训项目;PCC需要自己开发的培训【培训
1.2 与CONSER和其他潜在合作伙伴,提供讨论平台、沙盒和测试平台,实验关联数据标准与应用(如BIBFRAME纲要与编辑器)【实验

战略方向2:PCC活动与投入与全球数据环境中有最高影响的(活动)保持一致(5个行动)
由基于记录的环境,转变到基于元数据陈述【三元组】与身份管理【唯一标识符】的动态集。
2.1 建立新的咨询委员会,代表来自有早期关联数据实验的项目和机构(如BIBFRAME、BIBFLOW、哈佛ISNI项目、LD4L及其后续项目),以指导关联数据运动将如何影响PCC标准和政策,并定位PCC能够对这种演变作出具体贡献的理想领域。【咨询委员会】
2.2 决定PCC如何参与书目中心与供应商界(ILS厂商、自动规范控制供应商、订约编目供应商和出版者),确保及时创建与采用可用于关联数据的产品与服务。【关联数据产品与服务】
2.3 建立在早期工作的建议,如何扩展PCC元数据贡献到RDA和MARC以外(如MODS最终报告)。把这些以前的努力放在新的关联数据机会环境中,进行当前需求评估,确认PCC能够如何更有效、更策略地贡献于数字馆藏的元数据提供。【数字馆藏的元数据】
2.4 评估关联数据环境对PCC当前采用的测度对项目贡献的计量与报告方法的影响。没有目录“记录”,决定什么具有足够的计数价值,以及为什么。【计量metrics】
2.5 建立工作组,建立转换现有MARC书目和规范记录/数据到关联数据格式以供共享所需的标准与准则【格式转换】

战略方向3:在规范控制从主要基于创建文本串的方法,转换到专注于管理身份与实体的方法中,提供领导(4个行动)
3.1 建立工作组,开发使用除LC名称规范档之外的规范数据源的最佳实践【新的规范数据源】
3.2 与其他机构、项目合作伙伴及社群(W3C、ISNI、ORCID、code4lib)合作,探索模型及建立合作身份管理所必要的基础设施【个人ID;没有包括VIAF?】
3.3 产生一份白皮书,给出围绕作品实体识别问题的高层概要。本文件应当考虑不同社群(如BIBFRAME、JSC、PRESSoo、Zepheira丛编组及其他)提出的作品实体的概念比较,以及多数据模型协同的影响。白皮书将解释作品标识符在关联数据环境中能够起到的作用,概述它们所引起的建模和元数据管理问题,向PCC提供灵活选项,以推进作品级元数据的提供与使用。【作品实体、作品级元数据】
3.4 调查选项并开发计划,扩展社群参与创建标识符与规范数据【扩大参与】

战略方向4:探索品牌与资助模型,支持PCC的战略方向与整个项目的可持续性(3个行动)
拓展其重心到RDA、MARC和LC词表之外。
4.1 在全球数据环境背景中定义PCC品牌。考虑一个名称,反映新的、更广泛的方向。评估战略方向对PCC成员和治理结构的影响。【改名】
4.2 寻求适当资助,支持PCC首创活动(如转换PCC到新数据环境;工具开发;培训开发)【项目资助】
4.3 考虑获取赞助的方式,开发对PCC项目和服务的某些方面的捐赠支持【赞助】