理解元数据标准类型之CNMARC版

    常见谈元数据标准的,感觉是越来越复杂、越听越糊涂,尤其不明白冒出来的“应用纲要”到底是什么,与元数据标准的关系如何。今天见到远洋过客的“理解元数据标准的类型,标准规范不再复),似乎茅塞顿开。正确与否不论,先按自己的理解画示意图一幅:
 元数据注册系统
(此图于2007-11-20根据远洋过客留言更新)
    再做一个通俗版,中文编目为例帮助理解:
元数据元素集是CNMARC;
数据取值除了照录的,依据的词表有《中图法》、《汉语主题词表》、代码表(如出版地、语种等),以及一些格式规定(如年代取公元年);
据(著录)内容由《中国文献编目规则》决定;
各类文献的著录细则(可能结合MARC字段)属于应用纲要;
数据交换格式现在采用ISO2709,未来可能采用ISO25577(marcXchange)
编目时由软件将交换格式转换成编辑格式,不同类型文献有不同的模板(schemas),产生不同的工作单。 
(静候远洋过客、Keven及各位指正)

书目控制未来工作组报告草案网络直播

LC去年11月成立的书目控制未来工作组,最终报告草案在推迟二个多月后,终于要露出庐山真面目,引起大批业内人士关注。11月13日,工作组在LC介绍草案内容,同时进行网络直播,一时访问者众,网路堵塞,以至没有几个人真正看清直播内容。由于大家的强烈关注,最终88分钟的直播内容未加编辑,在16日全部放到了LC的网络广播网站供在线观看(Draft Report: Future of Bibliographic Control),同时工作组网站也提供了下载网址(Webcast: November 13, 2007,Interim Draft Report and Recommendations),还可直接选择看各个部分,不必从头到尾收看。网站上还有会场所放PPT下载(16页),可以了解报告基本框架。

前些日子为11/16上海联合编目中心年会准备一个“编目未来”的报告,所以一直关注工作组的进展。10/30见消息说报告11/13发布,还以为可以赶着报道最新进展。从13日晚就开始访问工作组网站,一直没有结果;看博客报道,都是报怨没看清直播,最终有关内容的报道都在15日以后了(我们这里是16日)。昨天先看到远洋过客的报道,而后又看了其他国外的博客报道。由于草案文本要到11/30发布,所以见到评论不多。

报道比较完整详实的,应该是与会的Karen Coyle。她的报道首先是三个主要变化(sea changes),对会场PPT中的"Working Group’s Guiding Principles",加了一些解释,更容易理解:
1、重新定义书目控制:包括所有资料、类型广泛的用户社区以及信息搜寻的不同地点
2、重新定义书目世界(bibliographic universe):包括所有利益相关者(stakeholders),包括参与信息传递与数字化的营利组织
3、重新定义LC的作用:作为其他图书馆与非图书馆机构的合伙人,一起达成图书馆界的目标
接下来是五个方面的建议(PPT中称为“结论”,Working Group’s General Conclusions),以及前四个建议的较详细内容,建议全部共有100多条,需等全文公布。五个建议/结论:
1、通过书目记录的合作与共享,通过使用整个供应链生产的数据,提高所有图书馆书目生产的效率
2、致力于高增值的活动。尤其是通过对图书馆拥有但当前仍隐藏而未用的独特资料提供访问,为知识创建提供更大价值。
3、技术定位:认识到WWW不仅是我们的技术平台,也是标准的适当平台。认识到用户不仅是人,而且是图书馆数据交互的应用。
4、通过增加资源的评价性、质量与数量分析,定位我们的未来。开展工作以认识FRBR框架所提供的潜力。
5、通过教育、通过开发能提供现在与未来决策的度量标准,强化图情专业。

报道较专深的是William Denton对于FRBR部分的讨论,综述了AUTOCAT邮件讨论组及一些博客的观点。前述PPT中对FRBR提到:
4.2 Realization of FRBR 重新认识FRBR
1. Develop test plan for FRBR 开发FRBR的试验计划
2. Temporarily suspend work on RDA 暂时停止RDA中[与FRBR]相关的工作
Karen文中对4.2的详细信息是:
认识FRBR:被称为FRBR的框架有很大的潜力,但至今未被测试。尽管FRBR本身未被清晰地理解,却被当作RDA的基础。工作组建议RDA不要做进一步工作,直到对FRBR及它对书目元数据所提供的基础做更多的调查。[好象听直播中讲到要与OCLC、IFLA等一起做试验工作]

期待最终报告……

附:书目控制未来工作组大事记
2006-6 LC副馆长Deanna B. Marcum在ALA年会上允诺建立外部咨询组
2006-11-2/3 工作组成立会议,决定召开三次专题会议
2007-3-8 第一次会议:“书目数据的用户与使用”
2007-5-9 第二次会议:“书目数据的结构与标准”
2007-7-9 第三次会议:“书目数据的经济学与组织”
2007-8-? 公开征求意见截止
2007-9-1 “最终报告”草案公示(推迟→2007-11-30)
2007-11-1 “最终报告”正式发布(推迟→2008-1-9)
200711-13 “最终报告”草案介绍网络直播
2007-11-30/12-1 “最终报告”草案文本公布(预定)
2007-12-15 “最终报告”草案公示结束
2008-1-8/9 “最终报告”发布(预定)

参见:
远洋过客:LC书目控制的未来工作组昨天的报告
Coyle’s InFormation: Future of Bibliographic Control,LC, 11/13
The FRBR Blog: WoGroFuBiCo uproar!

书目控制未来工作组:关注2007年11月 (2006-12-12)
书目控制未来工作组会议:用户与使用 (2007-03-10)

国际机构库调查出版

    Primary Research Group新出报告《机构数字典藏国际调查》(International Survey of Institutional Digital Repositories, 121p. ISBN 1-57440-090-8)。报告调查了11个国家的56个机构库,国家包括美、加、澳、德、南非、印度、土耳其等,内容包括费用、经费、软件、人员、开放存取政策、营销、与职员及其他内容贡献者的关系,以及与管理与设计机构库相关的其他问题,含300多个表(简介与摘要:http://www.primaryresearch.com/200711071-Information-Science-excerpt.html)。

   一些调查数据如下:

经费:
机构库启动时平均花$78,802
15.56%的机构库主要经费来自赠款

软件:
近41%购买软件开发其机构库,美国的比例更高
1/6图书馆使用数字共用(Digital Commons)软件,28%美国机构库用此产品
14.81%机构库计划在未来两年中购买新软件

人员:
每年仅需人工500小时以下、预算少于$9,000,最大的那些需3600小时以上、预算平均$145,444
运行机构库所需人工的5.21%来自不隶属于图书馆的学术部门

历史、内容与访问
机构库平均存在时间性2.85年,最长的近10年
现有机构库中12%以上内容来自以前存在的机构库
机构库收录期刊文章的均值为772,中位数162
机构库中4.88%的期刊文章限按页读 [意指不能整篇下载?]

营销:
仅5.56%机构库使用博客公布其机构库,近41%使用纸质宣传小册子

Via IFLA Mailing List (2007-11-9)
[DIGLIB] International Survey of Institutional Digital Repositories Published
by James Moses, Research Director, Primary Research Group Inc.