LRM到schema.org映射(荷兰国家图书馆)

荷兰国家图书馆(KB)从2015年开始发布关联数据,采用schema.org。2017年确定采用《IFLA图书馆参考模型》(LRM)、RDA及关联数据发布国家书目,因此制订LRM到schema.org映射作为应用纲要。(出处:René Voorburg. Linked Data Initiatives at the National Library of the Netherlands. Core Linked Data Interest Group forum, 2021-7-29。视频2’20”-16’45”

LRM to Schema.org Cheat sheet (v0.9.3, 2020-11-30) 

目前发布的并非完整映射表,而是一套指南、规则和样例。对于采用schema.org作为词表、以LRM建模时面临的问题有很好的指导,涉及WEMI类及其关系属性,各类连续出版物及其卷、册,Agent(尤其是其中的个人)及Nomen,元数据描述作为实体(不同于实体本身)。摘译如下(命名空间schema:有时简化为s:;编号为本人另拟)

一、WEMI实体

<Work> a schema:CreativeWork .
<Expression> a schema:CreativeWork, schema:ProductGroup.
<Manifestation> a schema:CreativeWork, schema:ProductModel .
<Item> a schema:CreativeWork, schema:IndividualProduct,  schema:ArchiveComponent.

二、连续出版物(表1 Classes for serial publications, groups and member)

 Series: 丛编Volume 卷Issue 期
Generic 通用s:CreativeWorkSeriess:PublicationVolumes:PublicationIssue
Books 图书s:Bookseriess:PublicationVolumes:Book
Periodicals 期刊s:Periodicals:PublicationVolumes:PublicationIssue
Newspapers 报纸s:Newspapers:PublicationVolumes:PublicationIssue
Comic books 漫画书s:ComicSeriess:PublicationVolumes:ComicIssue

三、个人(Person)

LRM和 schema:Person 的“个人”定义并不完全兼容, LRM 实体“个人”仅限于真实人物、明确排除虚构人物,而 schema.org 则包括虚构人物。例如,在 LRM 中,J.K. 罗琳(J.K. Rowling)、罗伯特·加尔布雷思(Robert Galbraith)和实际的乔安妮·罗琳(Joanne Rowling)作为“个人”是相同的;而在schema.org 中,允许将这三个角色(persona)视为三个不同的schema:Persons,可用关系schema:sameAs 将派生自一个LRM个人 的schema:Persons 链接在一起。注意schema:sameAs 与owl:sameAs的语义不同,owl:sameAs 背后的语义本质上会导致将两个 schema:Persons 合并为一个,如此以不同笔名出版的图书、无法推断其在图书上所用名称。

四、命名(Nomen)

不为 LRM命名实体提供对应的 schema.org,仅使用字符串文字或 URI。RDF 允许为字符串指定属性,例如其语言和文字(遵循 BCP4710)。示例:

<URI_of_publisher> schema:name "Paskov Dom"@ru-Latn .
<URI_of_publisher> schema:name "Пашков Дом"@ru .

另以schema:Person 实体聚类 Nomens(作为文字字符串),类似当前管理名称规范记录的做法。

五、WEMI内部关系(Table 2 Hierarchical relations for WEMI entities in schema.org

schema.org只有两层:schema:exampleOfWork(父实体)和schema:workExample(子实体),下表粗体为首选:

object:
subject:WorkExpressionManifestationItem
Works:workExamples:workExamples:workExample
Expressions:exampleOfWorks:workExamples:workExample
Manifestations:exampleOfWorks:exampleOfWorks:workExample
Items:exampleOfWorks:exampleOfWorks:exampleOfWork

六、其他关系

  • 派生:schema:isBasedOn
  • 翻译:schema:translationOfWork
  • 数字化:schema:isBasedOn(载体表现),schema:encodesCreativeWork(单件)
  • 部分与整体:schema:isPartOf / schema:hasPart

七、实体模板和片断

WEMI、个人和元数据共6种实体,提供模板和样例片断,基本包罗了常用元素/属性。如载体表现(其他实体略):

schema:publication [
a schema:PublicationEvent ;
schema:name "{publisher imprint as captured}" ;
schema:startDate "{yyyy}"^^xsd:gYear ;
schema:location "{place as literal <URI>}" ;
schema:publishedBy <{URI_of_Agent_/publisher}> ;
] .
schema:isbn "{isbn}" ;
schema:issn "{issn}" ;
schema:numberOfPages "{literal / integer}" ;
schema:height: "{literal}" ;
schema:width: "{literal}" ;
schema:material "{literal_or_URI}";
schema:image "content_URL or schema:ImageOject" ;
schema:bookEdition "{bookedition}" ;
schema:contributor <{URI_of_contributor}> ;

《IFLA图书馆参考模型》中译本发布

今天看到国图罗翀主任在微信朋友圈的消息:IFLA LRM中译本在IFLA官网正式发布,翻译工作做了两年。

我最关心的是一些术语的中译名,特别如Res、Agent、Nomen,以及aggregate/aggregating/aggregation等。立刻去官网下载:

IFLA Library Reference Model (LRM)(目前有9种译本:加泰罗尼亚语、汉语、西班牙语、意大利语、立陶宛语、匈牙利语、葡萄牙语、乌克兰语、德语/仅部分)

汉语翻译人员:协调:顾犇;翻译(按姓氏拼音排序):蔡丹、李菡、杨恩毅、袁硕;审校(按姓氏拼音排序):罗翀、赵丹丹

部分译名列举

  • 用户任务(第三章):查找、识别、选择、获取、探索(explore)
  • 实体(第四章):
  • LRM-E1资源(Res)
  • LRM-E2作品、LRM-E3内容表达、LRM-E4载体表现、LRM-E5单件
  • LRM-E6行为者(Agent)、LRM-E7个人、LRM-E8集体行为者【本人曾用过“行为者/行为主体/施事者”,没有坚持用“行为者”主要觉得是个生造词(“行为人”不是,但因为Agent含集体、用“人”不合适)】
  • LRM-E9命名(Nomen)、LRM-E10地点、LRM-E11时间段(Time-span)
  • 关系(第四章):有称谓(has appellation)
  • 实体关系图(第五章):作品“通过…实现”(isrealized through)内容表达“具体化在”(is embodied in)载体表现“由…例证”(is exemplified by)单件【没变】
  • 5.2实体和队列(Alignments)之间的约束
  • 5.5书目身份(Identities)的建模
  • 5.7合集(Aggregates)的建模:集合作品(Aggregateing Work)/集合内容表达(Aggregating Expression)【本人曾译Aggregating为“汇总……”,因为觉得是个动名词】

有官方翻译版,今后引用就不用纠结了。特别希望在RDA环境下再也不要把Agent译为“代理人”了——作者怎么会是什么“代理”?

参见:

IFLA-LRM的“合集”(笔记)

题记:一直不知道“Aggregate(s)”如何翻译比较准确。认真看了IFLA-LRM的定义及包含类型,觉得可以译成“合集”,相应的动词/动名词“Aggregating/Aggregation”则可译为“汇总”。
“合集”(Aggregate)在概念上类似于以前通称的“汇编”(Compilation)或“合订”(Binding),但汇编或合订通常针对单行著作,合集的范围则更广,也因此需要一个新名词、表达新概念。
以下为IFLA-LRM“5.7 合集建模”笔记。

1、合集(Aggregate)定义
体现(包含)多个内容表达的载体表现。【注意:合集是“载体表现”】
2、三种不同类型
(1)内容表达合集汇编(Aggregate Collections of Expressions)
汇编:多个独立创作的内容表达的集合,一起“出版”为单个载体表现。
包括:选集,单行丛编,连续出版物各期,等等。
例子如:期刊各期(文章合集),多部小说一同出版为单卷,章节独立拟定的图书,CD汇编(单曲合集),不同作品合集/选集。
(2)增强合集(Aggregates Resulting from Augmentation)
增强合集=单个独立作品、补充一个或多个依赖性作品。
即内容表达补充了非原始作品组成部分的其他材料,又没有显着改变原始内容表达。【没有成为新作品】
增强作品例子:前言,导论,插图,注释,等。增强资料不一定重要到需要不同的书目标识【意指可以著录也可以忽略】。
(3)并列内容表达合集(Aggregates of Parallel Expressions)
指单个载体表现包含相同作品的多个并列(多种语言)内容表达。
场景:多语言环境下的手册和官方文件,网站中不同语言的相同资料,原始语言+译文的出版物,可选声音语言和字幕语言的电影DVD。
3、载体表现与内容表达的多对多关系
一个内容表达常会有多个载体表现,而一个载体表现也可包含多个内容表达(合集正反映这种情况)——这也是WEMI实体间唯一的多对多关系。
4、汇总作品与被汇总作品(aggregating work / aggregated works)
按定义,合集是“载体表现”。但是汇总“内容表达”的过程本身是智力或艺术工作,因此满足作品准则。在组合内容表达及随后创建合集载体表现的过程中,汇总者创建了“汇总作品”。
汇总作品的实质是选择和安排准则,它不包含被汇总作品本身【或者说是因为,汇总者不对被汇总作品负责】,不适用整体-部分关系
合集不应与按部分创作的作品如多部曲小说混淆。【“汇编”指多个“独立创作”
那么,汇总作品与被汇总作品是什么关系?从图5.7看:没有直接关系,经由合集载体表现间接产生关系。
5、合集一般模型(图5.7)
Fig 5.7