常见谈元数据标准的,感觉是越来越复杂、越听越糊涂,尤其不明白冒出来的“应用纲要”到底是什么,与元数据标准的关系如何。今天见到远洋过客的“理解元数据标准的类型,标准规范不再复杂”),似乎茅塞顿开。正确与否不论,先按自己的理解画示意图一幅:
(此图于2007-11-20根据远洋过客留言更新)
再做一个通俗版,以中文编目为例帮助理解:
元数据元素集是CNMARC;
数据取值除了照录的,依据的词表有《中图法》、《汉语主题词表》、代码表(如出版地、语种等),以及一些格式规定(如年代取公元年);
数据(著录)内容由《中国文献编目规则》决定;
各类文献的著录细则(可能结合MARC字段)属于应用纲要;
数据交换格式现在采用ISO2709,未来可能采用ISO25577(marcXchange);
编目时由软件将交换格式转换成编辑格式,不同类型文献有不同的模板(schemas),产生不同的工作单。
(静候远洋过客、Keven及各位指正)
Excellent! 以后一定要讲这个图用到我们的课程中和教材中!
三个建议:第一,这些标准之间的关系如果只在registry 下面,是正确的。但要是不从注册的角度看,还应该有一张图来讲解它们的成分之间的可能的关系。比如,Content standards也是要选定一套elements来讲解的,这些可以(但不必要)从element set中来。另外,一个元素内的value可以有多个词表来源。一个词表或者authority file可以支持不止一个元素/字段。
第二,应用纲要必须从元数据表中选元素。所以在表中要有加上从元数据表到应用纲要的有箭头的线。
第三,如果再作一个图,或许可以在实线和虚线上还加上简单的表达关系的词。
呵呵,不好意思,要求越来越多了。也许Keven和雨师可以一起把这些关系抽象化出来。
不好意思,忘了雨僧这个元数据高手了。
昨天贴好后想到应该再加两条线,想想还是听听高手们的意见再改。
根据第一和第三个建议,那张图可相当难画。功力不够,画出来肯定漏洞百出。自己只能在原图上小补了。
指正哪敢,学习还有所不逮。本来感觉很清楚的,倒是给远洋的评论以及这幅图示弄得有些糊涂了。
我的理解:
1、元数据元素集是描述资源各个方面的属性词表;
2、元数据取值如果规定只能从某些词表中选取,这些词表就属于受控的规范词表;这属于元素取值的domain和range;
3、元数据应用纲要是为了领域应用而制订的元数据方案的一种表达形式,目前正在成为规范的,叫做“DC元数据应用纲要”,核心是符合DC抽象模型的元数据形式化表述(也就是一种机读形式),通常可以以RDF形式表达;
4、应用模型(规定应用领域的各类实体及其相互关系)、著录规则等文档,也可以成为元数据应用纲要的组成部分;
5、元数据注册系统可以作为元数据元素的命名域管理体系而存在,但命名域并非一定需要注册系统进行管理;
6、元数据元素词表,包括规定元数据取值的规范词表,都可以看成是一种人工语言,每个术语都应该被赋予唯一的URI,都可以通过注册系统进行管理;
7、元数据形式化的表达必须采用基于XML的RDF或OWL等的Schema,著录工作单当然可以通过完整表达元数据方案各种关系和约束的schema来自动生成,并进行校验。当然这需要一定的环境和软件工具来实现;
……
至于这几种元数据标准的分类,感觉在概念上有交叉,是从应用角度来分类,并不具有严格的意义。
学习。
能把K师搞糊涂一点,很不容易啊。再试图解释一下,详见Lib 2.07。
http://cnlib20.ning.com/profiles/blog/show?id=509559%3ABlogPost%3A9465