FRAD的新增实体(兼及实体vs属性/关系)

FRAD:Functional Requirements for Authority Data (2009)
2013修订改正版:Functional Requirements for Authority Data: A Conceptual Model
中文翻译版 :规范数据的功能需求:概念模型(中国国家图书馆翻译)

——— 实体还是属性/关系?———
FR系列为“实体-关系”模型,定义实体及其属性/特性(Attribute)、实体与实体间关系(Relationship),对应于资源描述框架(RDF),分别是类(Class)及属性(Property)——Property 包括 Attribute 和 Relationship。
一直没仔细看过FRAD,以为FRAD只是在FRBR定义的3组共10个实体基础上增加了“家族”。实际上,为方便规范数据建模,FRAD在11个书目实体(FRBR的10个+家族)之外,还增加了5个实体:名称、标识符、受控检索点、规则和机构。其中名称和标识符在FRBR中以其他实体的属性形式出现。

将某一事物定义为一项属性还是一个独立的实体是设计概念模型的关键”(FRAD,2研究范围)。
BIBFRAME从1.0到2.0,就经历了相当数量的事物定义由属性变为类的过程(也有少量反过来的)。BIBFRAME认为,用类表达类型相对于属性的3个优点(2017-8-1) 是:可重用、易查询、可柔性降级
FRAD的看法是个人/家族/团体及其名称定义为实体比属性更灵活、减少冗余:“FRBR模型的设计者认为, 为了与模型中的其它实体关联,将个人和团体定义为实体显然更适用。……具有更好的灵活性,同时去除了将其表示为属性时常出现的数据冗余性问题。这些实体的名称可以在规范记录中得到控制,并根据需要与其他规范记录、书目记录或馆藏记录相关联。”FRAD保留此做法的同时,还将新增加的“名称和标识符视为实体,更加清晰地表示了规范数据所描述的实体间的关系、认知实体和创建受控检索点所依据的名称和(或)标识符间的关系。”(FRAD,2研究范围)
与之相对,另外一些实体间关系,在FRAD中被定义为实体的属性:“出于研究需要,一类实体事例与另一类实体事例间的关系则简单视其为前者的属性。例如,团体和地点的关系,如果对该团体机构建立受控检索点,其中暗含该机构的地点,这时如果将地点只作为团体的一个属性也就足够了。”——FRAD延续FRBR,有“地点”实体(FRBR第3组实体),但这没有妨碍它把各种地点作为FRBR第2组实体的属性:个人的出生地、死亡地、居住地,与家族/团体相关联的地点等。FRAD认为,“这样处理并没有妨碍以后完善模型时,将两者的关系处理为更正式的实体间的关系。”(FRAD,3.3实体关系图)
不但原本是实体的某些地点被定义为属性,原本是实体的某些团体也被定义为另一个实体“机构”(负责创建和修改受控检索点的团体),显然是为了方便建模。
如此定义实体后,规范数据的概念模型为:“机构”根据“规则”,在书目实体的“名称”和“标识符”的基础上,构建“受控检索点”

FRAD 2009 zh_figure 2

FRAD 图2 规范数据的概念模型

——— FRAD的新增类(“家族”除外) ———
1 名称:一个字符或一组词和(或)字符,现实世界中的实体通过它们被认知。[出自 FRBR,有修改]【FRBR中是不同实体的属性】
注:编目规则可能规定某地点的名称既代表地理区域本身又代表对该区域拥有管辖权的政府(例如马萨诸塞,既可代表马萨诸塞州又 可代表马萨诸塞州政府,其官方名称是马萨诸塞联邦)。
注:有些单元是名称中不可或缺的部分,有些单元则是因创建受控检索点而附加在名称中的部分,编目规则在处理这些单元时可能不同。
2 标识符:在限定的某标识符所标识的领域内,用于区别其他实体与某实体相关联的一个数字、代码、词、短语、图标、图案等。【FRBR的载体表现和单件有此属性】
注:这些标识符只限于相关联的实体,并不包括规范记录中的记录号。【区别实体RWO与其描述(规范记录),虽然规范记录号也应该可以作为标识符】
3 受控检索点:一个名称、术语、代码等,通过它们可以找到某书目记录、规范记录或参照。[出自 GARR,有修改]【受控检索点的作用在于查找相应的记录,而非实体本身的代表】
4 规则:受控检索点(规范形式、变异形式或参照)格式和(或)记录应遵循的指令集合
5 机构:负责创建和修改受控检索点的团体。机构负责应用和阐释其创建和(或)使用的规则,也可以负责其领域内标识符的创建和维护。【团体,为方便规范记录建模而从书目实体中独立出来】

说明1:名称、标识符、受控检索点都是实体的标识,因而在LRM被合并为超类Nomen(源于FRSAD)。
说明2:各种属性基本上可以在LRM中找到或确切或宽泛的对应。比较值得注意的是“受控检索点”的一个属性:
未区分检索点:名称规范形式(即:规范检索点)的受控检索点不足以区分两个或者更多具有同样名称的实体。
在国家图书馆的个人名称规范记录中,有不少以所著图书的研究方向做区分,随意性比较大,并未产生有质量的规范控制。“国家图书馆随后也意识到此类问题,于是规定对于同名的不同作者无法进行区分时,则首选已有的未加区分的规范记录,建于同一条规范记录内,不再对数据进行刻意区分。这种做法曾一度存有争议,但从 FRAD 对实体的定义中我们找到了一定的理论依据,并在一定程度上缓解了数据的不规范现象。根据 FRAD 对个人实体的定义,个人也可能包括使用同一名称的个体集合,为集合中的每个个人建立不同的身份是不可行的”(朱青青, 孙凤玲. FRAD与中文名称规范控制之研究. 国家图书馆学刊, 2012, 2:19-22)。——最后一句所引FRAD“个体集合”原文为“clusters of individuals”,即一群人。

2017年IFLA新标准(6项)

IFLA标准网站 IFLA Standards(未列出所有标准)

8月正是IFLA年会,IFLA专业委员会审查通过了《IFLA图书馆参考模型》(LRM)。大会同时发布新闻,汇总2017年IFLA已经及即将公布的新标准。
New IFLA Standards in 2017 (2017-8-22)
年会新闻,链接了新标准介绍英文版,作为IFLA的7种官方语言之一,还有新标准介绍中文版
已经发布的4个标准都在广义的编目范畴(照抄各标准简介附后):
国际图联图书馆参考模型(LRM)
PRESSoo的定义:有关连续出版物和其他连续性资源书目信息的概念模型
国际编目原则(ICP)2016版
FRBRoo的定义:面向对象的形式化的书目信息概念模型

即将公布的2个(8月18日国际图联专业委员会会议批准),介绍中没有简介、说明为“即将上线”:
图书馆对无家可归人士的服务指南 Guidelines for Library Services to People Experiencing Homelessness
目前IFLA网站上有今年早些时候的全球评审(截止期2017-5-21)草案

国际图联ISBD在RDF中的命名空间之翻译指南 IFLA Guidelines for translations of the IFLA ISBD namespace in RDF
目前网站上有2015年1.0版:Guidelines for translations of the IFLA ISBD namespace in RDF (2015)
参见:IFLA《翻译ISBD之RDF命名空间指南》发布(2015-5-7)
另外在ISBD评审组网站的 Publications from ISBD Review Group,还有一个相关标准:
ISBD用作关联数据指南 Guidelines for Use of ISBD as Linked Data (2016)
目前是2016年8月最终草案,看来获批之路漫长。

——— 国际图联图书馆参考模型(LRM)———
IFLA Library Reference Model (LRM) (2017年8月国际图联专业委员会审查通过)
国际图联LRM是在实体-关系模型框架下开发的高层概念参考模型,是对FRBR、FRAD、FRSAD这三个独立发展的国际图联概念模型的整合。
国际图联LRM的推出旨在解决这三个独立模型之间的不一致之处。新的模型对原有三个模型中涉及的每一项用户任务、实体、属性和关系都进行了审核,也对相关概念做了修订,但同时也需要进行重构,以构建有意义的整合。整合结果便是目前这个单一、简化且逻辑一致的模型,它涵盖了书目数据的所有方面,同时也适用于当前的概念模型实践。
国际图联LRM旨在应用于关联数据环境,支持并推动关联数据环境下的书目数据使用。
参见:
IFLA图书馆参考模型中的Nomen实体(附LRM成为IFLA标准)(2017-8-25)
FRBR家族新进展:LRM 2017年3月版、IFLA标准PRESSoo 1.3发布(2017-5-25)
《FRBR图书馆参考模型》评审反馈(2016-5-7)
《FRBR图书馆参考模型》全球评审(2016-2-29)
FRBR统一模型:开发中的FRBR图书馆参考模型(2015-8-19)

——— PRESSoo的定义:有关连续出版物和其他连续性资源书目信息的概念模型 ———
Definition of PRESSoo: A conceptual model for Bibliographic Information Pertaining to Serials and Other Continuing Resources (2017年3月国际图联专业委员会会议上获审通过)https://www.ifla.org/publications/node/11408
今年早些时候发布的PRESSOO是一个正式本体,旨在揭示连续性资源及更具体的连续出版物(期刊、报纸、杂志等)的书目信息。该模型是对FRBROO模型(面向对象的书目记录的功能需求)的扩展。FRBR反之又是对CIDOC CRM的扩展,CIDOC CRM是文化遗产信息的概念参考模型。
PRESSOO旨在为FRBR家族模型应用于连续出版物和连续性资源时长期存在的问题提供解决方案。
参见:
FRBR家族新进展:LRM 2017年3月版、IFLA标准PRESSoo 1.3发布(2017-5-25)
FRBRoo的连续出版物扩展——PRESSoo(2014-2-13)

——— 国际编目原则(ICP)2016版 ———
Statement of International Cataloguing Principles (ICP) 2016
国际编目原则的第一版,即广为熟知的“巴黎原则”,已经出版50余年。【2009年出版ICP】国际图联现在出版了最新的修订版,即国际编目原则(ICP)2016版。
这个版本立足于世界强大的编目传统,以及国际图联功能需求家族概念模型。
这些原则旨在指导编目代码的发展和编目员所做的决定,应用于书目和规范数据,也由此应用于现行的图书馆编目和图书馆创建的书目及其他数据集。它们的目标是为所有类型的书目资源提供统一的资源描述和主题编目方法。
参见:
《国际编目原则声明》(2016版)发布(2017-3-5)
《国际编目原则声明》2015版(草案)(2015-8-20)

——— FRBRoo的定义:面向对象的形式化的书目信息概念模型 ———
Definition of FRBRoo: A Conceptual Model for Bibliographic Information in Object-Oriented Formalism (标准委员会发布)
FRBROO是书目数据的一个本体或更高层次的概念模型。这个模型与国际图联的FRBR家族概念模型紧密相关;它是这些模型的面向对象版本。FRBROO的第一版只基于FRBR;而第二版基于三个模型:FRBR、FRAD和FRSAD。
参见:
FRBRoo 2.4作为IFLA标准发布(2017-3-20)
FRBRoo中的“事件”(2016-10-16)
“FRBRoo模型与环境学术研讨会”笔记(2016-10-14)
FRBRoo 2.4笔记(2016-10-6)
FRBRoo读后(2014-2-9)

IFLA图书馆参考模型中的Nomen实体(附LRM成为IFLA标准)

——— 引言:LRM成为IFLA标准 ———
IFLA图书馆参考模型(FRBR-LRM / IFLA-LRM),在2016年上半年征求全球评审。正式版未能在2017年初如期发布,然后到5月先期发布了3月版(IFLA Library Reference Model (LRM) – March 2017 version – available),等着今年年会期间获批。8月18日,IFLA专业委员会终于通过,与其他几个编目相关文件一起公布成为IFLA标准。
IFLA Library Reference Model (LRM)
日前在IFLA网站发布的8月版(网页8月17日更新),封面仍注明等待批准,只是日期由3月改成了8月。
这几天正好在看3月版。没有逐一比对,只发现 Table 4.3“属性/特性等级”中遗漏的 LRM-E9-A1(名称)类别,在8月版中仍然遗漏。

参见:
FRBR家族新进展:LRM 2017年3月版、IFLA标准PRESSoo 1.3发布(2017-5-25)
《FRBR图书馆参考模型》评审反馈(2016-5-7)
《FRBR图书馆参考模型》全球评审(2016-2-29)

——— Nomen的起源 ———
在《书目记录的功能需求》(FRBR)中,原本是没有Nomen(名称)实体的,Nomen是在《主题规范记录的功能需求》(FRSAD)中引入的。
主题在FRBR中定义为第3组实体,有4个:概念、实物、事件、地点(一直被诟病缺少时间)。当然主题也可能针对第1组4个实体和第2组3个实体——《规范记录的功能需求》(FRAD)增加了家族实体。
FRSAD建模时,抛弃了FRBR/FRAD定义的所有实体,引入更高层的新实体,采用拉丁文标识:主题Thema,以及其名称Nomen。
LRM作为FR家族的统一版,保留了Nomen实体,将其扩展为所有实体的名称。在LRM中,名称本身是“实体”,而不是其他实体的“属性/特性”(Figure 4.1)。实体的实例由名称来指代,但名称并非实例本身(4.1.3)——比如个人及其称呼,是2个不同的实体(的实例)。
与此同时,无所不包的Thema实体似乎变成了模型中的顶层实体Res(资源)——如此说来,似乎是FRSAD模型构成了整个LRM的底层结构。LRM没有对实体分组,也没有针对主题的实体,泛化的主题在LRM中通过Work(作品)实体和Res实体之间的一对互逆“关系” has as subject / is subject of 来表示,表示方法与FRBR(Figure 3.3)作品与三组实体间的主题关系 has as subject 相同。

——— 实体 LRM-E9 Nomen 名称 ———
以下摘录LRM中与Nomen有关的内容,基于2017年3月版【略有标注】。

Nomen定义:实体与指称它的称呼之间的关联

Attribute 特性/属性(9个:类别、Nomen字符串、方案、目标受众、使用情境、参考源、语言、文字、文字转换)
LRM-E9-A1 Category 类别。3种类型:1 被命名事物的种类(个人名称、作品题名等);2 名称被证实的来源(书脊题名、逐页题名等);3 名称的功能(标识符、受控检索点、分类号等)
LRM-E9-A2 Nomen string Nomen字符串。可以用任何形式的符号表示,如书写系统中的符号组合、化学结构符号、数学符号或其他任何类型的符号,如声音等。
LRM-E9-A3 Scheme 方案。2种编码方案:1 值编码方案(主题词表,叙词表,分类法,名称规范表等);2 语法编码方案(日期编码标准等)
LRM-E9-A4 Intended audience 目标受众【样例:特定年龄层次、特定语言对象】
LRM-E9-A5 Context of use 使用情境【领域?样例中取值有:文学作品,评论作品,数学作品,侦探小说】
LRM-E9-A6 Reference source 参考源。类别:1 传记辞典、百科全书等;2 其他方案;3 任何出版物;4 等等【样例为规范记录,MARC 21用670字段,UNIMARC用810字段】
LRM-E9-A7 Language 语言
LRM-E9-A8 Script 文字
LRM-E9-A9 Script conversion 文字转换

Relationship 关系(5个,有互逆关系:称谓、分配、等同、部分、派生)
LRM-R13 RES has appellation NOMEN 称谓(一对多,互逆关系 is appellation of)【各种变异名称】
LRM-R14 AGENT assigned NOMEN 分配/赋值(一对多,互逆关系 was assigned by)。在书目情境中,名称的赋值【机构】适用于主题词、受控检索点、标识符等的创建。
LRM-R15 NOMEN is equivalent to NOMEN 等同(多对多)。两个名称是同一Res的称谓【多个名称指代相同资源】
LRM-R16 NOMEN has part NOMEN 部分(多对多,互逆关系 is part of)。一个名称是使用另一个名称作为组件构造的【部分的样例:个人名称中的姓氏;个人规范检索点中的生卒年】
LRM-R17 NOMEN is derivation of NOMEN 派生(多对一,互逆关系 is derivation of)。一个名称被用作另一个名称的基础,两者都是同一资源的称谓【派生出来的样例:首字母缩略词;基于编目规则的作品规范检索点】

5.4 图书馆情境中的Nomen
在图书馆情境中,个人、集体代理(如家族和团体)或地点的Nomen传统上称为名称(Name),作品、内容表达和载体表现的Nomen称为题名(Title),而用于主题情境中的资源Nomen以不同方式称为术语、叙词、主题标目和分类号
标识符是一种Nomen类型,其目的是在特定的应用领域中具有持久性和唯一性……。标识符通常由规范分配机构根据商定的规则分配。分配机构的实例包括但不限于 ISO 标识符的登记机构、为公民和居民提供标识符的国家政府。标识符系统的范围可能很广(如 URI)或高度专门化(特定作曲家作品的目录编号)。
在图书馆信息系统中,受控检索点是一种Nomen,传统上被分配用于为个人、集体代理(即家族和团体)、作品和内容表达提供搭配【名称】,以及作为其他实体用作“has as subject”关系的对象【主题】。
在当前的图书馆实践中,名称规范记录通常是为每个具有书目重要性的Nomen群集创建的【只对部分实体做规范记录】,它们指代实体的同一实例,并同时记录表示检索点的首选形式(一个Nomen)的Nomen字符串和对应于任何变异检索点或标识符(附加Nomen)的Nomen字符串。虽然规范记录控制Nomen,但作为Nomen所指代实体的实例的快捷方式信息,通常与有关Nomen的信息记录在同一规范记录中,从而模糊了实体资源和Nomen之间的区别。目前图书馆实践中使用的各类规范记录的建模是相当复杂的,超出了本模型的范围。