《元数据》与metadataetc.org

    曾蕾与秦健教授新作《元数据》6月出版:
Metadata / Marcia Lei Zeng and Jian Qin

                        
New York: Neal-Schuman, 2008.        London : Facet Publishing, 2008.
ISBN 9781555706357 (US)                   ISBN 9781856046558 (UK)

    想着什么时候有中文版呢,试译目录[2008-7-13根据内容大纲中文版wiki更正、增加部分翻译,wiki上有完整目次]:

第1部分 元数据基础 Fundamentals of Metadata
第1章 导论
第2章 当前标准
2.1 通用元数据(DC, MARC系列)
2.2 文化物件与可视资源元数据(CDWA, CDWA Lite, VRA Core)
2.3 教育资源元数据(LOM)
2.4 档案与保存元数据(EAD)
2.5 版权管理元数据(copyrightMD, ODRL)
2.6 科技资源元数据
2.7 多媒体元数据(PBCore)
2.8 人物、代理的元数据描述(VCARD, FOAF)

第2部分 元数据构建 Metadata Building Blocks
第3章 Schemas:结构与语义
第4章 Schemas:句法
第5章 元数据记录

第3部分 元数据服务 Metadata Services
第6章 元数据服务
第7章 元数据质量检测与改进
第8章 实现元数据互操作
 
第4部分 元数据研究展望 Metadata Outlook in Research
第9章 元数据研究概观

附录:资源与参考源 Sources and References
A. 元数据标准–元数据表、应用纲要、注册站 Metadata Standards — Metadata schemas, application profiles, and registries
B. 受控词表和内容标准 Value Encoding Schemes and Content Standards
C. 术语

    目录译自www.metadataetc.org的《元数据》教科书部分,有各章阅读书目及练习,以及附录A与B──没看到书,看附录也能增长不少知识。

    曾教授对www.metadataetc.org的介绍同样值得一看(《元数据》教科书和网页“出炉”)。除了网站三大部分(上述《元数据》教科书部分、wiki部分、元数据教学BBS),令人感兴趣的还有网站背景云图及制作方法(生成软件http://tagcrowd.com/),“本月图片”敦煌莫高窟第407窟“隋三兔藻井”──顺着链接Three Hares Homepage看这三个共用三只耳朵兔子的网站,原来世界各地都有呢,这比看wiki部分的SKOS中文翻译有意思多了:)──期待下月的图片了,因为不只是图片啊。另:建议为image of the month存档,如果只保留一个月太可惜。
    因为喜欢,选贴上面网站其他两张世界各地三兔图:

         
埃及或叙利亚瓷器碎片,约公元1200年    

法国Wissembourg圣彼德与保罗教堂天花板,约公元1300年

    该网站还链接有更多相关网站、这些网站还有更多图片,如西藏古格王国白庙中的四兔图:

呵呵,喧宾夺主了;-)

理解元数据标准类型之CNMARC版

    常见谈元数据标准的,感觉是越来越复杂、越听越糊涂,尤其不明白冒出来的“应用纲要”到底是什么,与元数据标准的关系如何。今天见到远洋过客的“理解元数据标准的类型,标准规范不再复),似乎茅塞顿开。正确与否不论,先按自己的理解画示意图一幅:
 元数据注册系统
(此图于2007-11-20根据远洋过客留言更新)
    再做一个通俗版,中文编目为例帮助理解:
元数据元素集是CNMARC;
数据取值除了照录的,依据的词表有《中图法》、《汉语主题词表》、代码表(如出版地、语种等),以及一些格式规定(如年代取公元年);
据(著录)内容由《中国文献编目规则》决定;
各类文献的著录细则(可能结合MARC字段)属于应用纲要;
数据交换格式现在采用ISO2709,未来可能采用ISO25577(marcXchange)
编目时由软件将交换格式转换成编辑格式,不同类型文献有不同的模板(schemas),产生不同的工作单。 
(静候远洋过客、Keven及各位指正)

IFLA的“数字对象元数据工作组”

    为应对日益增加的数字出版物的编目工作,国际图联编目组在2005年成立了“数字文本文献书目标准工作组”(Working Group on a Bibliographic Standard for Digital Text Documents),2006年该工作组改名“数字文本文献书目建议工作组”(Working Group on Bibliographic Recommendations for Digital Text Documents),2007年再次改为“数字对象元数据工作组”(Working Group on Metadata for Digital Objects)。工作组计划在2008年IFLA加拿大魁北克年会前提交最终报告,作为编目指导委员会在年会上的一项活动。
    名称的不断更改,体现着工作组应对形势变化而对工作目标的改变:1、从文本型数字对象扩大到任意数字对象;2,从狭义的书目扩大到广义的元数据(也从图书馆扩大到了更广阔的领域);3、从强势的标准转为较温和的建议、指南。真是一年一个样,三年大变样。

工作组主要任务(Charge)
    为需要创建、共享与管理元数据者推荐一份指南,包括元素、工具、格式、协议。
基于以下原则开展工作:该指南是高层次的指南,意即[方括号后为本人理解]:
* 应当作为语义映射的轴心(a pivot for semantic mapping),也即作为一部数据元素词典,不同的社区可以映射他们自己的书目数据集
* 应当作为关于如何在文本文件中处理书目数据的指南[应当是纯文本数据]
* 不应当预设任何特定的标记系统[MARC也罢、XML也罢],但
* 应当作为一个针对可能采用的不同标记系统的模型,并且
* 应当适用于最通用的文本编辑程序
* 应当定义一个属性集,包括如语言、字体、大写规则等(language, script, capitalisation practice)[?],以方便进一步处理

    小组已经召开了三次会议,但没有关于这份指南的更详细信息,可能要到2008年3月第四次会议以后,才能看到草案。

    目前小组成员均来自欧洲:丹麦(主席)、法国、瑞典、荷兰、挪威。2006年时还有一位代表IT组的中国人(张智雄),据称由于未提出任何建议而不再作为成员。

参见:
IFLA. Cataloguing Section. Working Group on Metadata for Digital Objects

第一次会议:2006/8/23,韩国首尔第72届IFLA年会期间(会议报告
第二次会议:2007/2,丹麦哥本哈根(?)
第三次会议:2007/8,南非德班第73届IFLA年会期间(会议报告
第四次会议:2008/3/17-19,法国巴黎