CALIS西文图书编目业务培训通知

    记得曾有网友留言,想知道西文编目培训信息,现发布最新信息一条:

CALIS西文图书编目业务培训通知

时间:2006年12月6-13日
地点:上海·同济大学图书馆
报名截止日期:2006年11月15日前,额满为止

通知全文见CALIS联机合作编目中心主页之“动态信息”。

MARC访问级记录(Access Level Records)

    一年多前,曾关注过访问级记录(Access Level MARC Records),这是美国国会图书馆对网络资源进行书目控制计划的一部分。概括地说,就是在进行规范控制、提供主题检索途径的前提下简化编目,也就是在最小级记录与完整级记录之间,确立一个中间层次的记录等级。

    合作联机连续出版物编目项目(CONSER)于7月24日推出了《连续出版物访问级记录工作组最终报告》(Via Catalogablog: Access Level Record for Serials)。这是一份完整的报告,有详细的摘要(Executive Summary),可以对访问级记录的各个方面有概要的了解;有详尽的附录A-P,看完后既可以直接应用访问级进行编目,还可以了解编目改善计划的一整套程序——当然对没有决策权的普通人,最直接的收益就是可以写文章投稿了。
   
Access Level Record for Serials Working Group Final Report
连续出版物访问级记录工作组最终报告
July 24, 2006
 
Table of Contents
Executive Summary
Text of Report
  Introduction 导论
  Background 背景
  Record Objectives 记录目标(功能、费用效益、符合现行标准)
  The Mandatory Element Set 必备元素集
  Cataloging Guidelines 编目指南
  Pilot Projects 试验方案
  Pilot Project Statistics 试验方案统计
  Time Study Results 时间研究结果 [节省时间]
  Record Acceptability 记录可接受性
  Other Survey Data 其它调查数据(编目员、评论者的反应)
  Pilot Study Factors 试验研究因子
  Applicability to Copy 套录编目的适用性
  Display Issues 显示问题
  Recommendations 建议
  Conclusion 结论
Appendices (pdf except where noted)

A: Background and Charge 背景
B: Participants 参与者
C: Core Data Set 核心数据集
D: Mandatory Element Set 必备元数集
E: Cataloging Guidelines 编目指南
F: Brainstorming Results 头脑风暴法结果
G: Pilot Project Instructions 试验方案指导
H: Pilot Survey Questions 试验调查问题
I: Cataloging Survey Data 编目调查数据
J: Record Review Survey Data 记录评价调查数据
K: Survey data spreadsheet (Excel) 调查数据表
L: Display Issues 显示问题
M: Cataloging Rules/R.I.s/Practices Recommendations 编目规则/规则解释/实践建议
N: MARC 21 Recommendations 机读格式建议
O: Sample draft pages: CONSER Metadata Application Profile 样例草案
P: Sample records 样例记录
 
    需要注意的是,该报告是针对连续出版物的,与之前LC实施访问级记录计划的内容有所不同。或许也是某种程度的更新?LC实施计划中的文件最初是2004年8月的,2005年作过更新,那时MARC记录头标第17位还规定访问级用“3”。

LC Implementation Plans for Access Level MARC/AACR Records
国会图书馆实施访问级记录计划
11/12/04 (rev. 06/23/2005)

Background 背景
Developing “Access Level” 开发“访问级”
Testing “Access Level” core data set and guidelines 测试“访问级”核心数据集与指南
Future plans for implementing “Access Level” 未来实施“访问级”计划
More Information 更多信息 [除指明外均PDF]
  Results of the Access Level Test (PPT) 访问级测试结果
  Mandatory Data Elements 必备数据元素
  Draft Cataloging Guidelines 编目指南草案
  Original Project Report 计划报告原本
  Core Data Set 核心数据集
  ALA 2005年会报告PPT (by David Reser):
    It’s all about Access! Defining an Access Level MARC/AACR Record 关于“访问”:定义访问级MARC/AACR记录
    Defining an Access Level Record for Remote Access Electronic Resources 为远程访问电子资源定义访问级记录

快速了解除以上两个年会PPT外,另可参见:
Renette Davis: Access Level Records for Internet Resources

MARC、MARC,为什么不死?

    最近正想把放在TPI学位论文库中的元数据导出,转入本馆的书目系统。要转入图书馆的书目系统,必须是MARC格式,而TPI只有导入MARC,没有导出MARC,所以必须自行编制处理程序,把原来的元数据转成MARC格式,心里很是不爽。

    正巧Keven在咒它,愿MARC“永垂不朽”。或许“MARC必须去死 (MARC must die)”,可它竟然如此不知趣,不肯自行退出历史舞台,需要别人来将它杀死 (Murdering MARC)?

    讲到MARC,必得话分两头。一头是MARC记录格式,也就是标记系统,如200、245这样的字段,$a、$3这样的子字段;另一头是MARC交换格式,也就是所谓的ISO 2709格式。
    以TPI元数据转换为例,要做两方面的处理。首先是一头,先做一个对照表,把需要的TPI元数据对应到MARC的字段、子字段。为生成完整的MARC记录,还必须添加一些TPI中没有的元数据。其次是另一头,让转出的元数据经处理后,形成2709格式。

    Keven说,“抛弃MARC最大的阻力应该来自图书馆所拥有的书目数据,以及业已装机的、成千上万的图书馆自动化系统。”在我看来应该不是。理由是:

一、图书馆所拥有的书目数据多半是2709格式的,这种格式只要编制合适的程序,可以很方便地批量转换成其它形式(反之倒未必)。
二、目前没有图书馆自动化系统(ILS)会以2709格式存储书目数据供检索。2709格式只是一个交换数据的标准格式,系统将MARC数据导入后,多半以某种数据库形式存储数据。
三、为提供检索,ILS需要在MARC数据导入时对各字段、子字段做索引。一个字段、子字段可以做成多个索引,如200$a题名可以做题名索引,也可以做关键词索引;不同字段、子字段可以做成一个索引,如CNMARC的200$a和MARC 21的245$a都可以做在题名索引中。因此MARC数据在转入系统后,如果不考虑数据转出的要求,无需保留原有的标记系统。
四、如果有可以替代2709格式的标准,只需更新ILS的数据导入部分,系统就可正常运行。
五、ILS中的书目记录编辑部分可能是需要做最多修改的部分,但基于以上“三”的原因,系统应当不需要完全重写。如Innovative系统在新建或编辑记录时,就可以不使用MARC格式。

    MARC的确是个老骨董了,与它同时代的计算机应用怕没几个还活得这么滋润的。这个,自然有它的理由。比如MARC是文本格式的,在四十年后的今天仍然可以用机器正常读出(虽然仍难看懂)。但我想最直接的理由,就是还没有制定出一个可以替代它的公认标准。
    美国国会图书馆(LC)早就制定出了MARC XML,把2709格式的MARC 21变成了可由通用(而非图书馆专用)软件处理的格式。RedLightGreen大概是第一个参照LC标准转换书目数据,实现FRBR集中同一作品功能的网上书目数据库了――顺便提一句,由于它的主人RLG被并入OCLC,RedLightGreen不久将会被关闭,想了解它的得尽早去看。
    也有其它MARC的XML格式,只是大家都不急着推广它们成为标准。理由不会是国际图联(IFLA)不尽心吧?
    喜欢传统MARC的人对XML不感兴趣,而喜欢XML的人则对MARC的字段、子字段不感兴趣,或许这才是真正的原因。

    我对MARC XML很有兴趣,并期望它能成为未来的书目元数据标准。理由当然不能是我熟悉那些字段、子字段。MARC的字段、子字段用在一般人看来莫名其妙的数字、字母,其实正是其优势所在。因为它没有语言障碍,更重要的是――没有文化障碍。在英语优势的环境下,应该是很重要的一种考虑。它比其它用自然语言做标识的元数据更有优势,可以做为中介语,直接对应至各国语言。

    也就是说,我希望保留MARC记录格式,而以MARC XML作为MARC交换格式标准,取代2709格式。
    当然,MARC记录格式本身还有两方面的问题需要改革:

一、MARC记录中很有一些冗余数据,是当年计算机处理能力有限时遗留下来的,有必要加以改革。
二、最令人痛心的是,MARC记录格式众多。比如目前国内一般中文用源自UNIMARC的CNMARC,西文用MARC 21;而在日文,CALIS用CNMARC,国图似乎用MARC 21。
    也该是统一的时候了――国际上,英国已放弃UKMARC改用MARC 21,德奥两国也在准备采用MARC 21。本来IFLA当年不以USMARC为标准,另起炉灶制定UNIMARC就是一个大错,至今仍抱着UNIMARC不放岂不是一错到底?

更新(2006-9-14 21:00)

    把博客当成笔记本,写完就忘记了。刚才看别的东西,忽记起其实早已有人在筹划一个可以替代2709格式的XML国际标准了,这个名为MarcXchange国际标准是对MARCXML的修订,原说是今年完成的,参见差不多一年前写的“ISO 25577: 2709格式的XML兄弟即将问世”。
    最新进展是,7月24日结束了投票,不知结果如何。可下载 ISO/DIS 25577 Information and documentation – MarcXchange 的正式投票版(PDF文件)。