DCMI和RDF学习记录

因为摘译《BIBFRAME纲要草案》(2014-8-24),感到自己以往道听途说的多,看过原文、真正了解的少。于是顺藤摸瓜,在暑假的最后一段日子里恶补了DCMI和RDF相关标准。

———- DCMI文档(Documents) ———-
– BIBFRAME纲要基于《DCMI描述集纲要》(DCMI Description Set Profiles, DSP,2008)
– DSP的主要用途之一《DC应用纲要》(Dublin Core Application Profiles, DCAP,指南2009),BIBFRAME纲要类似于此
– DSP相关概念出自《DCMI抽象模型》(DCMI Abstract Model, DCAM,2007)
– DCAM建立在RDF基础上:《以资源描述框架(RDF)表达DC元数据》(Expressing Dublin Core metadata using the Resource Description Framework (RDF),2008)
这样一圈下来,看了不少DCMI文档。
体会:看到“以RDF表达DC”附录A样例,感觉DC抽象模型的表达要比RDF复杂、不直观,不如直接用RDF?

看得差不多了,才在不经意间发现DCMI文档的翻译页面:Translations of DCMI Documents,由其中的中文版链接到上海图书馆的都柏林核心元数据网站。以前自然是访问过的,但这次没想到先查下。
上图DC网站上有张MM和夏MM译的DCAM,2004版PDF,订正了自己的几个译名——如果先看,先前看原文时就不至于为中译名词纠结了。两个版本在结构上变化不大,粗略看2007版的变化:
1、新增literal(文字/字面)和value surrogate概念(后一概念在RDF中也未见到,不知有何渊源)
2、不再有refine(限定)和qualifier(修饰词)概念 [更正 2014-9-24:仍有refines,说明子属性关系;上位/下位则说明超类/子类]
3、DCMI资源模型、描述模型中没有了Class(类)
2007版的2.4附注称:“DCMI描述集模型不提供明确机制指明被描述资源的类。被描述资源的类可以用该描述中的一个或多个陈述明确指明,也可以由用于该描述的属性的领域推断”。

DCAM (2007) Figure 1 – the DCMI resource model
DCAM (2004) Figure 1 – the DCMI resource model
DCAM (2007) Figure 2 – the DCMI description set model
DCAM (2004) Figure 2 – the DCMI description model

DCAM (2004) 图出自:DCMI Abstract Model (2004-12-08)
DCAM (2007) 图出自:DCMI Abstract Model (2007-06-04)

– 顺便对照了《DCMI元数据术语》(DCMI Metadata Terms,2012),比2006版多了两个类型:
1、Classes(22个):作为术语的范围(has range)或领域(has domain)
2、Terms related to the DCMI Abstract Model(2个:memberOf , VocabularyEncodingScheme):用于词表引用
为什么“类(Class)”在DCAM和DCT这两个标准中有这样的一增一减,要请教高人了。

DCAM (2007) Figure 3 – the DCMI vocabulary model

 

———- RDF标准(RDF Current Status) ———-
BIBFRAME纲要符合RDF,而DC也有RDF表达。语义网、关联数据,都离不开RDF。

从RDF入门开始。发现中文的W3学校内容在三年中已经大大丰富了,找到RDF,很轻松地看完了——因为太初级了。(参见:学网站制作,上W3学校,2011年9月15日)

入门显然是不够的。要了解所有词汇,看标准原文是个好选择,于是找到W3C,发现RDF标准在2014年初更新了,包括了更多序列化格式(Turtle、N-Quads、N-Triples、TriG、JSON)。随便浏览,发现URI现在被IRI(Internationalized Resource Indicator)取代了。(见:RDF 1.1新变化

W3C标准不少有其他语言译本,包括简体中文和/或繁体中文,RDF方面有2004年的《资源描述框架(RDF):概念与抽象语法》《RDF入门》。虽然不是今年的标准、而且十年间变化不小,但看原文时有中文版可参考,会轻松不少。对中文版译者心存敬意。
本想先看中文版学习,但看不下去——因为从目录看,新旧文件变化还是很大的,怕纠结半天的内容现在已经没有了,白白浪费脑细胞。最终只认真看了RDF新变化RDFS入门和“抽象模型”只浏览一过。非技术人员,看时完全没有体会,只能说头脑中有了一个初步印象。