FRBRoo读后

FRBRoo问世已久(2009年6月1.0版),一直没有看,昨天大致浏览一遍。
FRBRoo(FRBR object-oriented version, harmonised with CIDOC CRM),即FRBR面向对象版,按CIDOC CRM网站“FRBRoo Introduction”的说明,“FRBRoo是一个正式的本体,意在抓取与表达书目信息的潜在语义,方便书目与博物馆信息的集成、中介与交换。

正式文件:FRBR, object-oriented definition and mapping to FRBRer (version 1.0)(146页pdf文件)
文件署名:FRBR与CIDOC CRM协调国际工作组(International Working Group on FRBR and CIDOC CRM Harmonisation),编辑:Chryssoula Bekiari,Martin Doerr和Patrick Le Boeuf。

看后梳理如下几个基本知识点:
1、FRBRoo是一个本体,定义了类(Class,对应FRBR的实体)和属性(Property,对应FRBR的关系);属性连接不同类,一个属性可能适用于多个不同的类。
– 类:将FRBR原来3组10个“实体”扩展为33个(名称为F1-F33),包括细化作品、内容表达和载体表现(子类)(1.2.2),以及增加“事件”(event)。
– 属性:将FRBR原来以样例说明的“关系”明确为31+8种(名称为R1-R31,以及8个“类属性”CLP)。未仔细对照是否有所扩展。对创作与生产过程加以分析,是FRBR与FRBRoo的差异之一(1.2.3)
– FRBR中的Attribute基本不在FRBRoo中(除CLP为针对F3的物理属性)。自己一直把Property和Attribute都译作属性,其实一直有点困惑两者的区别。网上查了下,一般建议是前者译为属性,后者译为特性。

2、FRBRoo基于FRBR和CIDOC CRM,文件中有各自的类和属性清单:
– FRBRoo类和属性清单(2.6、2.7)
– 参引的CIDOC CRM类和属性清单(4.3、4.4)
还有多种对照表:
– FRBRoo类与CIDOC CRM部分类的等级校准(2.5)(CIDOC CRM的类用E1-E90表示)
– FRBRoo属性与CIDOC CRM部分属性的等级校准(2.5)(CIDOC CRM的属性用P1-P148表示)
– FRBR本身(FRBRer)与FRBRoo映射(3)(FRBR章节号对照)

3、FRBR第一组4个实体WEMI,在FRBRoo中被区分为5个类,分别有如下层次:
– F1作品——F2内容表达——F3载体表现生产类型(Manifestation Product Type)——F5单件
– F1作品——F2内容表达——F4载体表现单例(Manifestation Singleton)
当载体表现只有一件时(非批量生产,如手稿),取F4(不用F3),此时其下没有F5单件

4、作品与内容表达还另细分有子类(2.5.1):
– 作品 F1
— 个别作品 F14——集合作品 F17
— 复杂作品 F15——连续作品 F18
— 容器作品 F16——集合作品 F17、录制作品 F21、出版作品 F19(——连续作品 F18)、表演作品 F20
– 内容表达 F2
— 独立内容表达 F22——出版内容表达 F24、表演计划 F25、录制 F26
— 内容表达片断 F23

5、除FRBR实体第1组(18个)、第2组(2个)、第3组(4个)外,类还有如下2种:
(1)名称 F12 和标识符 F13
(2)事件
创作 E65 ——作品概念 F27、内容表达创作 F28(——录制事件 F29、出版事件 F30)
活动 E7 ——表演 F31
生产 E12 ——载体生产事件 F32、复制事件 F33

6、FRBR是静态的实体-关系,表现活动的结果;而CIDOC CRM是动态的,以事件(Event)表现创作等活动过程。FRBR与FRBRoo的首要差别就是后者引入了时间实体、事件与时间处理过程(temporal entities, events and time processes,1.2.1)。
被图书馆编目洗脑多年的人,对动态与静态的区别需要细细体会(下图引自CIDOC CRM网站)。

Work and Expression, Static view
作品和内容表达的静态视图
From Work to Expression, dynamic view
从作品到内容表达的动态视图

———附:中文资料———

印象中以前看到过中文相关论文的,这次竟然没查到。用FRBRoo查全文,CNKI上只有3篇,大致都是进展综述中涉及而非专论;万方6个结果全是外文;维普则完全查不到。摘录其中一篇的片断:
顾犇. 第76届国际图联大会编目相关论文评析. 中国图书馆学报, 2010,36(5):82-87
(p.83)FRBRoo即面向对象的FRBR(书目记录的功能需求),FRBRoo书目数据模型是CIDOC概念参考模型(CRM)形式化、普遍的本体的一部分,是国际图联推出的FRBR(书目记录的功能需求)与国际博物馆理事会下属的国际文献工作委员会提出的CIDOC CRM这个面向对象的概念参考模型之间协调的结果。促进FRBRer(实体- 关系的FRBR)和FRBRoo的持续发展是国际图联编目组2009/2011战略计划的一部分。……FRBRoo是为了弥补FRBR中的一些缺陷而提出的。

另外查到一个比较全面的PPT——台湾中兴大学图书资讯学研究所张慧铢2012年在“資訊組織進階班”上的《FRBR家族的發展與應用》,FRBRoo(译为“FRBR物件导向”)部分包括开发过程、简介、功能、架构、FRBR和CIDOC CRM间转换对照、表演艺术应用及未来发展。摘取对“事件”的解说部分:
– 书目产品是创作和生产过程的结果
• FRBR采取“静态”的观点为其构建模型,不包括任何相关事件(events)
• 在CIDOC CRM中,事件(event)是主要的概念,时间实体(temporal entities)扮演主要的角色,是连接物件【对象】与时间(time‐spans)、地点、和关系人(agents)的唯一方式
• FRBRoo的作品概念(F27)产生一个想法,然后内容表达创造(F28)同时产生了内容表达(F2)和它的第一个载体表现(以载体表现单件(F4)的形式出现),两者共同实現了一个作品(F1),见下图(引自CIDOC CRM网站)

Work and Time
作品与时间

EURIG采用RDA调查-2012报告

《EURIG采用RDA调查-2012报告》,调查截止日期2012年3月15日,报告完成日期2012年7月。面向欧洲RDA兴趣小组的30个成员,收到20个回复。将近一年过去了,情况或有所改变。
2012调查报告要点:
* 实施:4个机构有明确的RDA实施计划:荷兰国家图书馆、不列颠图书馆和德国国家图书馆2013年实施,芬兰国家图书馆2015年实施。另外12个机构期望在2012-1015年做出决定。
* 翻译:9个机构表示有积极的RDA翻译计划,计划翻译RDA为法语、芬兰语、德语、葡萄牙语、挪威语。此外,西班牙语翻译已由哥伦比亚出版社Rojas实施。[计划或进行中的翻译有7种语言:法语、芬兰语、德语、葡萄牙语、挪威语、西班牙语、汉语]
* 培训:7个机构已经或正在准备培训资料,其中3个资料在网上提供:
Special Libraries Cataloguing – 英语培训资料
法国国家图书馆 – 法语培训资料
德国国家图书馆 – 德语培训资料

———-EURIG采用RDA调查-2012报告(不完全翻译)———-
EURIG survey on adoption of RDA – 2012: report (K. Gryspeerdt, 20 July 2012. 8 p.)
1、实施RDA
4个机构有明确的RDA实施计划:3个机构计划2013年实施──荷兰国家图书馆、不列颠图书馆和德国国家图书馆,1个机构计划2015年实施──芬兰国家图书馆。
其余16个机构没有决定实施RDA,但大多数[12个]期望在2012到2015年做出决定。其中2个的决定依赖于LC的实施决定(Casalini Libri、Special Libraries Cataloguing [分别为意大利和加拿大的编目外包商])。当大多数来自LAC和LC的衍生记录为RDA时,SLC会开始创建RDA记录,可能在2013年5月。
4个机构没有说明什么时候做出实施RDA的决定([法国]高等教育书目机构ABES、华沙大学图书馆NUKAT中心,葡萄牙国家图书馆、西班牙国家图书馆)
2、所用描述编目规则
10个机构采用AACR2或其修订形式[还是这类机构最有动力];3个机构使用RAK-WB。其余如:西班牙国家图书馆使用西班牙标准(RdC),自2009年起补充ISBD作为临时措施;萨格勒布国家和大学图书馆使用国家编目规则“字顺目录汇编条例与手册”。
3、所用格式
13个组织采用MARC21;3个组织使用UNIMARC:ABES、葡萄牙国家图书馆、法国国家图书馆;2个使用MAB2:UPC奥地利、德国国家图书馆。其他使用格式包括:MODS、DCx、MPEG21、danMARC2, BIBSYSMARC (基于MARC21), NORMARC (基于MARC21), INTERMARC, Pica/Pica3/Pica+。
大部分机构只采用一种格式,但有3个机构用多个──荷兰国家图书馆采用MARC21、MODS、DCx、MPEG21和Pica3/pica+;法国国家图书馆采用UNIMARC和INTERMARC;德国国家图书馆采用MARC21、MAB2和PICA。
4、目前使用的图书馆系统/平台
最多的是Aleph (Ex Libris),7个机构;4个机构使用本地系统/平台;Virtua (VTLS) 4家;Voyager (Ex Libris) 3家;Sirsi Dynix的Horizon、Symphony和Unicorn各1家。其他包括:DDELibra (Axiell), BIBSYS, MAVIS, OCLC/PICA, Amicus (WeCat)。
5、数据库结构
大多数(14个机构)描述其当前数据库结构为“关联书目和规范记录”,对应RDA实施方案2;4个机构认为其当前数据库结构为完全关系/面向对象──萨格勒布国家和大学图书馆、挪威国家图书馆、斯洛伐克国家图书馆、Casalini Libri [对应RDA实施方案1?理解或不完全];2个机构描述其当前数据库结构为“平面文档”[对应RDA实施方案3];1个机构(丹麦图书馆和媒体局)不能回答此问题。
如果/当机构实施RDA,4个机构期望其数据库系统从关联书目和规范记录、强化到完全的关系/面向对象数据库系统[RDA实施方案1]──法国国家图书馆、拉脱维亚国家图书馆、华沙大学图书馆NUKAT中心、芬兰国家图书馆;2个机构不能说明RDA实施后其数据库结构──萨格勒布国家和大学图书馆(因为没有决定实施RDA)、丹麦图书馆和媒体局。
6、FRBR化
大多数(13个机构)没有决定回溯FRBR化其数据;其余4个计划回溯,3个没有回溯计划。
大多数(11个机构)没有决定FRBR化其用户界面;其余8个计划,1个没有回答。
7、翻译RDA
约一半(9个机构)表示有积极的RDA翻译计划,计划翻译RDA为法语、芬兰语、德语、葡萄牙语、挪威语。此外,西班牙语翻译已由哥伦比亚出版社Rojas实施;6个机构无翻译计划;5个机构仍在决定是否翻译RDA──翻译为克罗地亚语、波兰语、瑞典语。
8、FRBR或RDA培训资料
7个机构已经或正在准备培训资料,其中3个资料在网上提供:
……[略,见前]
大多数机构(14家)没有准备培训资料(一家2个类别都选)

ONIX方面对BIBFRAME的评论

出版行业的元数据标准ONIX由EDItEUR维护。BIBFRAME模型草案发布后,EDItEUR的首席数据架构师Graham BellBIBFRAME邮件组中发表了评论,涉及到ONIX背后的概念模型<indecs>及其与FRBR模型的异同。翻译并[简评]如下:

[BIBFRAME] Comments on BIBFRAME draft model from EDItEUR (2012-11-29)

对报告概述的BIBFRAME模型草案,我们的第一反应很大程度上是正面的。然而,对于缺乏“单个复本”实体(以及BIBFRAME“实例”实体潜在的令人困惑的命名),我支持对此表示保留的评论。我想澄清一些报告中涉及的对ONIX和< indecs >的误解。
[第一句完全是客套话。本段其实是在质疑BIBFRAME类的设置及其名称。BIBFRAME有4个主要类,对应FRBR“单件”的不是独立的类,而是属于“注释”类;对应FRBR“载体表现”的,是“实例”类]

如同FRBR,<indecs>是一个概念模型。事实上,<indecs>包含两个基本模型:报告中引用的商务模型(“人们做东西、用东西、交易东西”),还有指代“东西”的“制作模型”或称“创作模型”(非常接近对应FRBR,尽管两者是完全独立开发的)。在目前语境下,相关的<indecs>是创作模型,基于3个而非4个概念层──抽象(Abstraction)(大约相当于FRBR内容表达,也明确是一个知识产权项目)、载体表现、单件。“内容表达”及相关的“定位”(Fixation),是抽象和载体表现间关系的方面。没有对应FRBR作品的。对熟悉的图书,“单件”就是单个复本,“载体表现”是一类相同的册(典型的以一个ISBN标识),“抽象”是许多潜在“载体表现”的抽象类,现在可以用一个ISTC(国际标准文本码)标识,可以与其他“抽象”形成多对多关系──这当然不只用于图书。
[<indecs>三层:抽象=内容表达-ISTC、载体表现、单件。对应BIBFRAME的三层是:作品、实例、注释中的馆藏]

在某种程度上,BIBFRAME草案近乎<indecs>。值得注意的是,<indecs>也预示了今天对关联数据的关注:“一项元数据即某人声称两个实体间存在的关系。” [1]

然而,<indecs>包含“单件”实体,而BIBFRAME模型草案没有,似乎是个奇怪的遗漏。我想说,必要时最好能够识别个别复本,能够分开适用于资源的个别复本的BIBFRAME“注释”,与适用于整个BIBFRAME“实例”的“注释”(“实例”组成所有复本的类)。
[注:BIBFRAME把“单件”归入“注释”之下]

如报告所说,图书ONIX(ONIX for Books)是部分基于<indecs>的,本身关注描述“载体表现”,尽管“载体表现”的很多属性无疑继承自“抽象”。图书ONIX最初由美国出版者协会(AAP)构想于1999年,2000年发布1.0版。进一步的联合开发经由EDItDUR实施,与书业研究组(BISG)和书业交流会(BIC)合作,但目前已由EDItDUR管理多年,由代表约20个国家用户组织的国际指导委员会领导,这些国家包括最近的中国、日本和阿拉伯国家。这是个真正的国际贸易标准,并且免费使用。
[ONIX有图书和连续出版物两种格式]

图书ONIX最广泛采用的是2.1版,发布于2003,之后只做过少量更新。最新发布的是3.0,有一个微小更新到3.0.1(增加了两个属性,用于非字母文字如日语汉字的人名或题名的语音排序)[2]。EDItEUR已经宣布2014年底为“日落之日”(sunset date),将减少对2.1的支持,鼓励所有实施者更新到3.0。

BIBFRAME模型草案与<indecs>的紧密校准(alignment),为商业元数据──以ONIX为例──与图书馆元数据之间更大程度的语义互操作提供了极大的希望。目前ONIX和MARC数据间的对照(Crosswalks)过于复杂,而BIBFRAME具有大大简化商业与图书馆数据交换的潜力。更大互操作的益处也可以延伸到音乐,如DDEX──相当于录音贸易中的ONIX──也基于<indecs>。
[或者说,既然BIBFRAME并没有采用FRBR,图书馆界也基于<indecs>算了?]

图书ONIX的关键价值之一是用于ONIX元数据的大量控制词表集(并且很大程度上在不同版本间共享)。EDItEUR将在未来数月内,(用SKOS)为每个术语发布权威的URI,如此这些术语将可被任何人用于发布关于图书或其他图书馆资源的关联数据。
[当年看ONIX,不知道其三层模型,感受最深的就是其词表的开放性,同一个“字段”,接受各种来源的词表,不像MARC格式那么严格规定采用一种。现在,RDA词表的出版还在磨磳中,ONIX词表已经要发布了──未来关联数据环境下,出版业将领先?]

连续出版物ONIX(ONIX for Serials)系列信息──最初由EDItEUR和NISO开发、现称订阅产品ONIX(ONIX for Subscription Products)──与图书ONIX相比,布署得相当有限,主要用于图书馆订阅代理者和主要期刊出版者之间的交流。相关信息标准特别用于如描述保留馆藏。

[1] The <indecs> Framework
[2] ONIX 3.0 Specification, Implementation and best practice guide, and latest controlled vocabularies