FRAD的新增实体(兼及实体vs属性/关系)

FRAD:Functional Requirements for Authority Data (2009)
2013修订改正版:Functional Requirements for Authority Data: A Conceptual Model
中文翻译版 :规范数据的功能需求:概念模型(中国国家图书馆翻译)

——— 实体还是属性/关系?———
FR系列为“实体-关系”模型,定义实体及其属性/特性(Attribute)、实体与实体间关系(Relationship),对应于资源描述框架(RDF),分别是类(Class)及属性(Property)——Property 包括 Attribute 和 Relationship。
一直没仔细看过FRAD,以为FRAD只是在FRBR定义的3组共10个实体基础上增加了“家族”。实际上,为方便规范数据建模,FRAD在11个书目实体(FRBR的10个+家族)之外,还增加了5个实体:名称、标识符、受控检索点、规则和机构。其中名称和标识符在FRBR中以其他实体的属性形式出现。

将某一事物定义为一项属性还是一个独立的实体是设计概念模型的关键”(FRAD,2研究范围)。
BIBFRAME从1.0到2.0,就经历了相当数量的事物定义由属性变为类的过程(也有少量反过来的)。BIBFRAME认为,用类表达类型相对于属性的3个优点(2017-8-1) 是:可重用、易查询、可柔性降级
FRAD的看法是个人/家族/团体及其名称定义为实体比属性更灵活、减少冗余:“FRBR模型的设计者认为, 为了与模型中的其它实体关联,将个人和团体定义为实体显然更适用。……具有更好的灵活性,同时去除了将其表示为属性时常出现的数据冗余性问题。这些实体的名称可以在规范记录中得到控制,并根据需要与其他规范记录、书目记录或馆藏记录相关联。”FRAD保留此做法的同时,还将新增加的“名称和标识符视为实体,更加清晰地表示了规范数据所描述的实体间的关系、认知实体和创建受控检索点所依据的名称和(或)标识符间的关系。”(FRAD,2研究范围)
与之相对,另外一些实体间关系,在FRAD中被定义为实体的属性:“出于研究需要,一类实体事例与另一类实体事例间的关系则简单视其为前者的属性。例如,团体和地点的关系,如果对该团体机构建立受控检索点,其中暗含该机构的地点,这时如果将地点只作为团体的一个属性也就足够了。”——FRAD延续FRBR,有“地点”实体(FRBR第3组实体),但这没有妨碍它把各种地点作为FRBR第2组实体的属性:个人的出生地、死亡地、居住地,与家族/团体相关联的地点等。FRAD认为,“这样处理并没有妨碍以后完善模型时,将两者的关系处理为更正式的实体间的关系。”(FRAD,3.3实体关系图)
不但原本是实体的某些地点被定义为属性,原本是实体的某些团体也被定义为另一个实体“机构”(负责创建和修改受控检索点的团体),显然是为了方便建模。
如此定义实体后,规范数据的概念模型为:“机构”根据“规则”,在书目实体的“名称”和“标识符”的基础上,构建“受控检索点”

FRAD 2009 zh_figure 2

FRAD 图2 规范数据的概念模型

——— FRAD的新增类(“家族”除外) ———
1 名称:一个字符或一组词和(或)字符,现实世界中的实体通过它们被认知。[出自 FRBR,有修改]【FRBR中是不同实体的属性】
注:编目规则可能规定某地点的名称既代表地理区域本身又代表对该区域拥有管辖权的政府(例如马萨诸塞,既可代表马萨诸塞州又 可代表马萨诸塞州政府,其官方名称是马萨诸塞联邦)。
注:有些单元是名称中不可或缺的部分,有些单元则是因创建受控检索点而附加在名称中的部分,编目规则在处理这些单元时可能不同。
2 标识符:在限定的某标识符所标识的领域内,用于区别其他实体与某实体相关联的一个数字、代码、词、短语、图标、图案等。【FRBR的载体表现和单件有此属性】
注:这些标识符只限于相关联的实体,并不包括规范记录中的记录号。【区别实体RWO与其描述(规范记录),虽然规范记录号也应该可以作为标识符】
3 受控检索点:一个名称、术语、代码等,通过它们可以找到某书目记录、规范记录或参照。[出自 GARR,有修改]【受控检索点的作用在于查找相应的记录,而非实体本身的代表】
4 规则:受控检索点(规范形式、变异形式或参照)格式和(或)记录应遵循的指令集合
5 机构:负责创建和修改受控检索点的团体。机构负责应用和阐释其创建和(或)使用的规则,也可以负责其领域内标识符的创建和维护。【团体,为方便规范记录建模而从书目实体中独立出来】

说明1:名称、标识符、受控检索点都是实体的标识,因而在LRM被合并为超类Nomen(源于FRSAD)。
说明2:各种属性基本上可以在LRM中找到或确切或宽泛的对应。比较值得注意的是“受控检索点”的一个属性:
未区分检索点:名称规范形式(即:规范检索点)的受控检索点不足以区分两个或者更多具有同样名称的实体。
在国家图书馆的个人名称规范记录中,有不少以所著图书的研究方向做区分,随意性比较大,并未产生有质量的规范控制。“国家图书馆随后也意识到此类问题,于是规定对于同名的不同作者无法进行区分时,则首选已有的未加区分的规范记录,建于同一条规范记录内,不再对数据进行刻意区分。这种做法曾一度存有争议,但从 FRAD 对实体的定义中我们找到了一定的理论依据,并在一定程度上缓解了数据的不规范现象。根据 FRAD 对个人实体的定义,个人也可能包括使用同一名称的个体集合,为集合中的每个个人建立不同的身份是不可行的”(朱青青, 孙凤玲. FRAD与中文名称规范控制之研究. 国家图书馆学刊, 2012, 2:19-22)。——最后一句所引FRAD“个体集合”原文为“clusters of individuals”,即一群人。