《主题规范数据的功能需求》(FRSAD)笔记

主题规范数据的功能需求(FRSAD):概念模型 / 编者:曾蕾、 Maja Žumer、 Athena Salaba. 2010年6月;刘莎翻译,翻译稿完成于2012年12月, 修订于2013年3月
参见:FRBR家族未来的第三个成员――FRSAR(2015-11-22)

中文版是很好的参考,看起来轻松不少,感谢译者的付出(全文翻译是需要勇气的)。需注意的是,译文偶有漏译(包括某些括号中的说明、甚至有整段),误译(有些从译文就能识别、有些则不然),引用时需注意判断并核对原文。另外中文版参考文献,忽略了原文中的脚注,仅保留了文后部分。

– 几个“名称”的翻译
name 名字(但name authorities等仍按习惯译为“名称”比较合适)
nomen 名称
appellation 称谓(依据:维基百科:广义上可以指名称;汉典:对人或物所加的名称)

– FRSAD的用户(2.2范围):与LRM不同
主题规范数据的用户包括:[1]创建与维护主题规范数据的信息从业者,[2] 创建和维护元数据的信息从业者,[3]查找信息满足信息需求的中介者和[4]最终用户。【LRM只针对真正的数据使用者,不针对数据的创建与维护者】

– 主题不含 isness,含 aboutness 和 ofness(2.2范围,2.3 关于和属于)
除了主题,一些受控词表提供的术语还表达作品的其他方面(如资源的形式、体裁、目标受众)……这些方面描述“是什么”……(如小说、戏剧、诗歌、散文、自传、交响乐、协奏曲、奏鸣曲、地图、素描、绘画、相片等),而不是作品是关于什么的。 这些特征某些在FRBR模型中已论述, 例如“作品的形式”“预期受众”等被作为作品的属性。
FRSAR工作组承认有关作品 ofness 的任何陈述都可能是一个主题陈述,而且很可能是目录用户检索的目标。因此FRSAD模型适用于主题检索中的 ofness 陈述(描述)的场景。

– FRSAD的两个实体: THEMA 和 NOMEN(3.2 一般框架)
THEMA 主题:用作作品主题的任何实体——FRBR 所有实体的超类【=LRM的Res】
NOMEN 名称:Thema被知晓、指代或称呼的任何符号或符号序列(字母数字符号、记号、声音等)——FRAD 实体 name, identifier, controlled accesspoint的超类【LRM沿用】
主题规范数据的功能需求( FRSAD)模型可以表示为(图 3.2: FRSAD概念模型):
作品 《- has as subject / is subject of -》主题《- has appellation / is appellation of -》名称

– 属性/特性【只定义通用特性/属性,实际取值由其他受控表选取或编码,解释见附录;与LRM、FRAD对照】
4.1 Thema(主题)的特性
4.1.1 type of Thema 主题类型【LRM-E1-A1 Category】
4.1.2 Scope note 范围注释【LRM-E1-A2 Note】
4.2 Nomen(名称)的特性
4.2.1 Type of nomen 名称类型【FRAD 名称的类型;LRM-E9-A1 Category 类别】
4.2.2 Scheme 方案【LRM-E9-A3 Scheme】
4.2.3 Reference Source of nomen 参考源【LRM-E9-A6 Reference source】
4.2.4 Representation of nomen 表达
4.2.5 Language of nomen 语言【FRAD 名称的语言;LRM-E9-A7 Language】
4.2.6 Script of nomen 文字【FRAD 名称的文字;LRM-E9-A8 Script】
4.2.7 Script conversion 文字转换【FRAD 名称的字母译音系统;LRM-E9-A9 Script conversion】
4.2.8 Form of nomen 形式
4.2.9 Time of validity of nomen 时效性【FRSAD(名称)使用的日期】
4.2.10 Audience 受众【LRM-E9-A4 Intended audience】
4.2.11 Status of nomen 状态【FRAD 受控检索点的状态】

– 关系
5.1 作品-主题关系:Work has as subject Thema / Thema is subject of Work【FRBR】
5.2 主题-名称关系:Thema has appellation Nomen / Nomen is appellation of Thema【FRAD】
5.3 主题-主题关系
5.3.1 Hierarchical Relationships 等级关系(属种关系、整体部分关系、类例关系、多等级关系、其他等级关系)
5.3.2 Associative Relationships 相关关系
5.4 名称-名称关系
5.4.1 Equivalence Relationship 等同关系
5.4.2 Whole-Part Relationship 整体-部分关系

– 用户任务(6.2):查询、识别、选择、探究(新引进任务)

– 附录【对FRSAD模型的解释及例解】
附录A. aboutness 模型【解释为什么FRSAD在经过试验及探讨5种方案后,放弃了包罗各种类型主题实体,只设置一个超级类】
附录B.FRSAD和FRBR与FRAD的关系【区别】
附录C. FRSAD模型和其他模型【SKOS、OWL、DCMI抽象模型】
把主题规范数据放在语义网发展的背景下,特别是从数据网的视角,由FRSAD模型化、由SKOS和OWL编码的主题规范数据将能够成为关联开放数据的一部分,并将有助于语义网的进一步发展。
附录D. 来自主题规范系统的例子
D.1 现存的thema类型的模型【不同词表差别大,“themas类型的结果因应用的不同而不同”,所以FRSAD模型只定义类型属性,没有给出取值词表】
D.2 主题规范数据中展示的THEMA—THEMA关系【Mercury 水银/水星在不同词表/分类法中的例子】
D.3 由来自不同体系的nomens展现相同的thema
D.4 来自受控词表或主题规范系统的显示记录例子

FRAD的新增实体(兼及实体vs属性/关系)

FRAD:Functional Requirements for Authority Data (2009)
2013修订改正版:Functional Requirements for Authority Data: A Conceptual Model
中文翻译版 :规范数据的功能需求:概念模型(中国国家图书馆翻译)

——— 实体还是属性/关系?———
FR系列为“实体-关系”模型,定义实体及其属性/特性(Attribute)、实体与实体间关系(Relationship),对应于资源描述框架(RDF),分别是类(Class)及属性(Property)——Property 包括 Attribute 和 Relationship。
一直没仔细看过FRAD,以为FRAD只是在FRBR定义的3组共10个实体基础上增加了“家族”。实际上,为方便规范数据建模,FRAD在11个书目实体(FRBR的10个+家族)之外,还增加了5个实体:名称、标识符、受控检索点、规则和机构。其中名称和标识符在FRBR中以其他实体的属性形式出现。

将某一事物定义为一项属性还是一个独立的实体是设计概念模型的关键”(FRAD,2研究范围)。
BIBFRAME从1.0到2.0,就经历了相当数量的事物定义由属性变为类的过程(也有少量反过来的)。BIBFRAME认为,用类表达类型相对于属性的3个优点(2017-8-1) 是:可重用、易查询、可柔性降级
FRAD的看法是个人/家族/团体及其名称定义为实体比属性更灵活、减少冗余:“FRBR模型的设计者认为, 为了与模型中的其它实体关联,将个人和团体定义为实体显然更适用。……具有更好的灵活性,同时去除了将其表示为属性时常出现的数据冗余性问题。这些实体的名称可以在规范记录中得到控制,并根据需要与其他规范记录、书目记录或馆藏记录相关联。”FRAD保留此做法的同时,还将新增加的“名称和标识符视为实体,更加清晰地表示了规范数据所描述的实体间的关系、认知实体和创建受控检索点所依据的名称和(或)标识符间的关系。”(FRAD,2研究范围)
与之相对,另外一些实体间关系,在FRAD中被定义为实体的属性:“出于研究需要,一类实体事例与另一类实体事例间的关系则简单视其为前者的属性。例如,团体和地点的关系,如果对该团体机构建立受控检索点,其中暗含该机构的地点,这时如果将地点只作为团体的一个属性也就足够了。”——FRAD延续FRBR,有“地点”实体(FRBR第3组实体),但这没有妨碍它把各种地点作为FRBR第2组实体的属性:个人的出生地、死亡地、居住地,与家族/团体相关联的地点等。FRAD认为,“这样处理并没有妨碍以后完善模型时,将两者的关系处理为更正式的实体间的关系。”(FRAD,3.3实体关系图)
不但原本是实体的某些地点被定义为属性,原本是实体的某些团体也被定义为另一个实体“机构”(负责创建和修改受控检索点的团体),显然是为了方便建模。
如此定义实体后,规范数据的概念模型为:“机构”根据“规则”,在书目实体的“名称”和“标识符”的基础上,构建“受控检索点”

FRAD 2009 zh_figure 2

FRAD 图2 规范数据的概念模型

——— FRAD的新增类(“家族”除外) ———
1 名称:一个字符或一组词和(或)字符,现实世界中的实体通过它们被认知。[出自 FRBR,有修改]【FRBR中是不同实体的属性】
注:编目规则可能规定某地点的名称既代表地理区域本身又代表对该区域拥有管辖权的政府(例如马萨诸塞,既可代表马萨诸塞州又 可代表马萨诸塞州政府,其官方名称是马萨诸塞联邦)。
注:有些单元是名称中不可或缺的部分,有些单元则是因创建受控检索点而附加在名称中的部分,编目规则在处理这些单元时可能不同。
2 标识符:在限定的某标识符所标识的领域内,用于区别其他实体与某实体相关联的一个数字、代码、词、短语、图标、图案等。【FRBR的载体表现和单件有此属性】
注:这些标识符只限于相关联的实体,并不包括规范记录中的记录号。【区别实体RWO与其描述(规范记录),虽然规范记录号也应该可以作为标识符】
3 受控检索点:一个名称、术语、代码等,通过它们可以找到某书目记录、规范记录或参照。[出自 GARR,有修改]【受控检索点的作用在于查找相应的记录,而非实体本身的代表】
4 规则:受控检索点(规范形式、变异形式或参照)格式和(或)记录应遵循的指令集合
5 机构:负责创建和修改受控检索点的团体。机构负责应用和阐释其创建和(或)使用的规则,也可以负责其领域内标识符的创建和维护。【团体,为方便规范记录建模而从书目实体中独立出来】

说明1:名称、标识符、受控检索点都是实体的标识,因而在LRM被合并为超类Nomen(源于FRSAD)。
说明2:各种属性基本上可以在LRM中找到或确切或宽泛的对应。比较值得注意的是“受控检索点”的一个属性:
未区分检索点:名称规范形式(即:规范检索点)的受控检索点不足以区分两个或者更多具有同样名称的实体。
在国家图书馆的个人名称规范记录中,有不少以所著图书的研究方向做区分,随意性比较大,并未产生有质量的规范控制。“国家图书馆随后也意识到此类问题,于是规定对于同名的不同作者无法进行区分时,则首选已有的未加区分的规范记录,建于同一条规范记录内,不再对数据进行刻意区分。这种做法曾一度存有争议,但从 FRAD 对实体的定义中我们找到了一定的理论依据,并在一定程度上缓解了数据的不规范现象。根据 FRAD 对个人实体的定义,个人也可能包括使用同一名称的个体集合,为集合中的每个个人建立不同的身份是不可行的”(朱青青, 孙凤玲. FRAD与中文名称规范控制之研究. 国家图书馆学刊, 2012, 2:19-22)。——最后一句所引FRAD“个体集合”原文为“clusters of individuals”,即一群人。

2017年IFLA新标准(6项)

IFLA标准网站 IFLA Standards(未列出所有标准)

8月正是IFLA年会,IFLA专业委员会审查通过了《IFLA图书馆参考模型》(LRM)。大会同时发布新闻,汇总2017年IFLA已经及即将公布的新标准。
New IFLA Standards in 2017 (2017-8-22)
年会新闻,链接了新标准介绍英文版,作为IFLA的7种官方语言之一,还有新标准介绍中文版
已经发布的4个标准都在广义的编目范畴(照抄各标准简介附后):
国际图联图书馆参考模型(LRM)
PRESSoo的定义:有关连续出版物和其他连续性资源书目信息的概念模型
国际编目原则(ICP)2016版
FRBRoo的定义:面向对象的形式化的书目信息概念模型

即将公布的2个(8月18日国际图联专业委员会会议批准),介绍中没有简介、说明为“即将上线”:
图书馆对无家可归人士的服务指南 Guidelines for Library Services to People Experiencing Homelessness
目前IFLA网站上有今年早些时候的全球评审(截止期2017-5-21)草案

国际图联ISBD在RDF中的命名空间之翻译指南 IFLA Guidelines for translations of the IFLA ISBD namespace in RDF
目前网站上有2015年1.0版:Guidelines for translations of the IFLA ISBD namespace in RDF (2015)
参见:IFLA《翻译ISBD之RDF命名空间指南》发布(2015-5-7)
另外在ISBD评审组网站的 Publications from ISBD Review Group,还有一个相关标准:
ISBD用作关联数据指南 Guidelines for Use of ISBD as Linked Data (2016)
目前是2016年8月最终草案,看来获批之路漫长。

——— 国际图联图书馆参考模型(LRM)———
IFLA Library Reference Model (LRM) (2017年8月国际图联专业委员会审查通过)
国际图联LRM是在实体-关系模型框架下开发的高层概念参考模型,是对FRBR、FRAD、FRSAD这三个独立发展的国际图联概念模型的整合。
国际图联LRM的推出旨在解决这三个独立模型之间的不一致之处。新的模型对原有三个模型中涉及的每一项用户任务、实体、属性和关系都进行了审核,也对相关概念做了修订,但同时也需要进行重构,以构建有意义的整合。整合结果便是目前这个单一、简化且逻辑一致的模型,它涵盖了书目数据的所有方面,同时也适用于当前的概念模型实践。
国际图联LRM旨在应用于关联数据环境,支持并推动关联数据环境下的书目数据使用。
参见:
IFLA图书馆参考模型中的Nomen实体(附LRM成为IFLA标准)(2017-8-25)
FRBR家族新进展:LRM 2017年3月版、IFLA标准PRESSoo 1.3发布(2017-5-25)
《FRBR图书馆参考模型》评审反馈(2016-5-7)
《FRBR图书馆参考模型》全球评审(2016-2-29)
FRBR统一模型:开发中的FRBR图书馆参考模型(2015-8-19)

——— PRESSoo的定义:有关连续出版物和其他连续性资源书目信息的概念模型 ———
Definition of PRESSoo: A conceptual model for Bibliographic Information Pertaining to Serials and Other Continuing Resources (2017年3月国际图联专业委员会会议上获审通过)https://www.ifla.org/publications/node/11408
今年早些时候发布的PRESSOO是一个正式本体,旨在揭示连续性资源及更具体的连续出版物(期刊、报纸、杂志等)的书目信息。该模型是对FRBROO模型(面向对象的书目记录的功能需求)的扩展。FRBR反之又是对CIDOC CRM的扩展,CIDOC CRM是文化遗产信息的概念参考模型。
PRESSOO旨在为FRBR家族模型应用于连续出版物和连续性资源时长期存在的问题提供解决方案。
参见:
FRBR家族新进展:LRM 2017年3月版、IFLA标准PRESSoo 1.3发布(2017-5-25)
FRBRoo的连续出版物扩展——PRESSoo(2014-2-13)

——— 国际编目原则(ICP)2016版 ———
Statement of International Cataloguing Principles (ICP) 2016
国际编目原则的第一版,即广为熟知的“巴黎原则”,已经出版50余年。【2009年出版ICP】国际图联现在出版了最新的修订版,即国际编目原则(ICP)2016版。
这个版本立足于世界强大的编目传统,以及国际图联功能需求家族概念模型。
这些原则旨在指导编目代码的发展和编目员所做的决定,应用于书目和规范数据,也由此应用于现行的图书馆编目和图书馆创建的书目及其他数据集。它们的目标是为所有类型的书目资源提供统一的资源描述和主题编目方法。
参见:
《国际编目原则声明》(2016版)发布(2017-3-5)
《国际编目原则声明》2015版(草案)(2015-8-20)

——— FRBRoo的定义:面向对象的形式化的书目信息概念模型 ———
Definition of FRBRoo: A Conceptual Model for Bibliographic Information in Object-Oriented Formalism (标准委员会发布)
FRBROO是书目数据的一个本体或更高层次的概念模型。这个模型与国际图联的FRBR家族概念模型紧密相关;它是这些模型的面向对象版本。FRBROO的第一版只基于FRBR;而第二版基于三个模型:FRBR、FRAD和FRSAD。
参见:
FRBRoo 2.4作为IFLA标准发布(2017-3-20)
FRBRoo中的“事件”(2016-10-16)
“FRBRoo模型与环境学术研讨会”笔记(2016-10-14)
FRBRoo 2.4笔记(2016-10-6)
FRBRoo读后(2014-2-9)