IFLA的“数字对象元数据工作组”

    为应对日益增加的数字出版物的编目工作,国际图联编目组在2005年成立了“数字文本文献书目标准工作组”(Working Group on a Bibliographic Standard for Digital Text Documents),2006年该工作组改名“数字文本文献书目建议工作组”(Working Group on Bibliographic Recommendations for Digital Text Documents),2007年再次改为“数字对象元数据工作组”(Working Group on Metadata for Digital Objects)。工作组计划在2008年IFLA加拿大魁北克年会前提交最终报告,作为编目指导委员会在年会上的一项活动。
    名称的不断更改,体现着工作组应对形势变化而对工作目标的改变:1、从文本型数字对象扩大到任意数字对象;2,从狭义的书目扩大到广义的元数据(也从图书馆扩大到了更广阔的领域);3、从强势的标准转为较温和的建议、指南。真是一年一个样,三年大变样。

工作组主要任务(Charge)
    为需要创建、共享与管理元数据者推荐一份指南,包括元素、工具、格式、协议。
基于以下原则开展工作:该指南是高层次的指南,意即[方括号后为本人理解]:
* 应当作为语义映射的轴心(a pivot for semantic mapping),也即作为一部数据元素词典,不同的社区可以映射他们自己的书目数据集
* 应当作为关于如何在文本文件中处理书目数据的指南[应当是纯文本数据]
* 不应当预设任何特定的标记系统[MARC也罢、XML也罢],但
* 应当作为一个针对可能采用的不同标记系统的模型,并且
* 应当适用于最通用的文本编辑程序
* 应当定义一个属性集,包括如语言、字体、大写规则等(language, script, capitalisation practice)[?],以方便进一步处理

    小组已经召开了三次会议,但没有关于这份指南的更详细信息,可能要到2008年3月第四次会议以后,才能看到草案。

    目前小组成员均来自欧洲:丹麦(主席)、法国、瑞典、荷兰、挪威。2006年时还有一位代表IT组的中国人(张智雄),据称由于未提出任何建议而不再作为成员。

参见:
IFLA. Cataloguing Section. Working Group on Metadata for Digital Objects

第一次会议:2006/8/23,韩国首尔第72届IFLA年会期间(会议报告
第二次会议:2007/2,丹麦哥本哈根(?)
第三次会议:2007/8,南非德班第73届IFLA年会期间(会议报告
第四次会议:2008/3/17-19,法国巴黎

远观中图学会2007年会

    今年的中图学会年会(2007/8/5-6),因为有了厦大的真宏伟全亮剑的全程直播、图文录音,动用了会议BlogMSN群,提供了不少PPT,怕是比往年更热闹——至少多了网上的关注者。
    因为一直在忙别的事,只略看了部分直播内容。开会的人差不多都该到家了,现补网络参会记事。
    没有看关于“图书馆核心价值研究”的主题发言PPT录音),但看了主持人的总结发言录音);没有看“图书馆服务宣言(草案)”,却看了8/6下午第十二分会场“图书馆服务宣言”大家谈,窃以为实乃“知其不可为而为之”。总之,都是双方或多方的PK,很有真正开会的样子。
    看了“中国图书馆学专业教育与职业需求的调查报告”(录音),的确如主持人总结点评录音)的那样,很精彩——总结点评本身也很精彩。没有看8/6第二分会场“中国图书馆学专业教育与职业需求——图书馆学教授与图书馆馆长的对话”的直播,估计不会像前一天那么和谐,PK大概也是免不了的。(详细报道参见:青一堂“做合格看客-中图年会分会“专业教育与职业需求”观之小结”)
    没有看8/6第四分会场“文献信息描述与组织的新进展及其对策”的直播,但下载了PPT看个仔细(PS:“基于网络的传统知识组织工具的发展及其对策”无法下载)。看“元数据标准及其互操作性的研究”,直是汗颜。马上桂林数图研讨班日程中有雨僧的“元数据互操作的逻辑框架”,Keven已推荐过,期待中。

update 2007-8-10:  中午与Keven、雨僧聚会,得知年会上的元数据互操作PPT中含不少曾蕾心血。网上查来,果然!再重看一遍PPT,恐怕还有其他人的心血呢。更为自己汗颜——该认真学习了!请参见原文:D-Lib Magazine, June 2006
Metadata Interoperability and Standardization – A Study of Methodology Part I : Achieving Interoperability at the Schema Level / Lois Mai Chan, Marcia Lei Zeng
Metadata Interoperability and Standardization – A Study of Methodology Part II : Achieving Interoperability at the Record and Repository Levels / Marcia Lei Zeng, Lois Mai Chan

参见:“中国图书馆学会2007年网络报道”Blog——“图书馆:新环境、新变化、新发展”
边上链接了学会网站上2004以来的年会专辑,可供回顾
年会大会开幕式演示文档,其中包括去年和今年志愿者各组的照片,还有2007中图学会志愿者活动博客报道集锦

四种来源的元数据

    Lorcan总结了图书馆中使用的四种描述性元数据(Four sources of metadata about things),并且分析了各自状况。他给暂时起的名:professional, contributed, programmatically promoted, and intentional。这样的分类非常清晰,可以弄清很多问题。简单摘译:

专业的 professional
应用编目规则、控制词表、规范档、地名词典等形成的。
[也就是一般编目员、标引员完成的,现存问题已经谈得很多了,此处略去]

贡献的 contributed
近年出现的邀请、集成、挖掘用户贡献的评价、推荐等数据形成的。
他们反映了人们之间的关系。图书馆开始实验这些方法,但单个图书馆恐怕难用得好。

程序获取的 programmatically promoted
由程序通过挖掘从数字资源本身获取的。
方法包括聚类 clustering、实体标识 entity identification、自动分类automatic classification等。

intentional
收集用户使用数据而来的。
Google的集成链接的Pagerank,亚马逊集成购买选择的推荐,OCLC的根据收藏馆数量的排序。

这四种元数据方法不仅不互相排斥,而且相互可以配合得很好。如:
规范档可支持在大量文本资源中识别由程序获取的人员、地名;
社交网络应用中反映出来的共享兴趣经抽象后,可形成intentional数据,产生推荐或“相关作品”服务;
标签与主题词表之间将发展形成关联与交互模式。