《书目控制未来报告》(草案)解读

美国国会图书馆(LC)的书目控制未来工作组(http://www.loc.gov/bibliographic-future/)于11月30日发布了《书目控制未来报告》草案(PDF, 315KB)。这几天到杭州做CALIS联机合作编目中心的西文图书编目培训,每晚拿着打印件认真研读。之前Karen Coyle的直播报导基本反映了草案的内容,看文本另有一些感受。

文首没有一般报告的铺陈,可谓开宗明义,“书目控制未来将是合作的、去中心化的、国际范围的、基于WEB的。它的实现将出现在与私营机构的合作,与图书馆用户的积极协作。数据将从不同来源获取,变化将迅速出现,书目控制将是动态的而非静态的。”(p.1)

阅读时最强烈的感受是,文中处处表明,在书目控制领域,曾经制定并维护了众多标准、提供了大量高质量书目与规范记录的LC,已不想再做老大(alpha library)(“去中心化”),只想做一个普普通通的联合编目成员馆(“合作”)。LC强调,它并非国家图书馆,所以不应当承担国家图书馆的上述责任(p.3)。当然LC是一个负责任的机构,不会立马撒手不干,这是报告三大指导性原则之一“重新定义LC的作用”部分要说明的内容(p.9)。
比较受鼓舞的是,LC将在WEB平台上更多地开放其内容。

作为曾经的编目员,正做着细致的编目培训,感受最深的是三大指导原则之首“重新定义书目控制”中的这段话:“单一环境如图书馆目录中描述(著录)的一致性,与各种环境间进行连接的能力相比,正变得不那么重要:Amazon到WorldCat到Google到PubMed到Wikipedia,图书馆馆藏只是其中的一个节点。在今天的环境下,书目控制不能再被看作局限于图书馆目录。”(p.7)
报告似乎吹响了抛弃MARC的号角,3.1.1建议“开发一个更灵活可扩展的元数据载体”,兼容WEB技术与标准,不限于图书馆数据实践。而系统供应商也将开发能够接受不同格式元数据的产品。(p.22) 有一些不能理解的是,报告称图书馆的元数据环境太复杂,检索协议环境也很复杂(p.24),不说这些标准多由LC主导或参与,如果再开发一个,岂不更增加其复杂性?

有一帮FRBR的粉丝,之前看到直播报告后,对于报告草案中“重新认识FRBR”中的一些说法很是不满。看过报告,发现其实LC还是很认可FRBR的,希望应用不限于“作品级”,并能够真正实用(p.28-30)。
LC真正不满的是RDA,不满者有四(p.24):
·在讫今为止的草案中看不出RDA所承诺的益处;
·不清楚根据RDA创建的元数据如何与现有元数据一致;
·转向RDA的工作方式不令人满意;
·采用RDA在改变工作流程与配套系统方面所需财力将被证明相当大
RDA原定2008年发布,从本草案看是2009年发布了,如果暂停(p.25),就不知何时了。10/22,JSC网站上刚公布了包括LC在内的英国、加拿大、美国、澳大利亚四个国家图书馆将在2009年前共同实施RDA的新闻(http://www.collectionscanada.ca/jsc/rdaimpl.html),不知道当初LC的代表(Barbara B. Tillett?)是不是具有代表权。直播当天她提了一个问题,似乎并未涉及此点。

其实在美国关于书目未来的争论还有一个重要的背景,就是编目专业人员的青黄不接(p.4)。报告表明,近三十年来,由于套录成为普遍现象,一直觉得对编目专业人员的需求会下降。而现在则面临编目员的大量退休,有素质的教学人员也变得稀缺(p.34)。所以报告的最后部分专门讲到要为今后的需求设计图情教育(包括网络课程),并且需求似乎在从图书馆转向信息业。[i.e./e.g.图书馆外包编目,编目员不再在图书馆工作,而在外包公司工作]

P.S. 博文写完,朋友建议将此主题写成论文。我想还是等2008/1/9“最终报告”发布以后吧。

update: 黄昏时才到家。因为外出不上网,数日未看博文。将陆续链接国内相关报道:
书蠹精:书目控制的未来 (2007-12-01 16:05:24)
http://blog.sina.com.cn/s/blog_495d626401000b98.html
Keven:简评“书目控制的未来”报告草案 (2007-12-1)
http://cnlib20.ning.com/forum/topic/show?id=509559%3ATopic%3A9862

关于书目控制未来工作组,参见:
书目控制未来工作组:关注2007年11月 (2006-12-12)
/posts/20061212222610.html

书目控制未来工作组会议:用户与使用 (2007-03-10)
/posts/20070310165723.html

书目控制未来工作组报告草案网络直播 (2007-11-18)
/posts/20071118125639.html

关于RDA,参见:
AACR终于准备出第3版了 (2005-01-13)
/posts/20050113202811.html
AACR3,副题名"Resource Description and Access"。计划出版日期2007年。

“英美编目条例”退出舞台:从AACR到RDA (2005-07-31)
/posts/20050731215049.html
AACR3不见了,正题名变成了原副题名的缩写RDA。出版日期推迟到2008年。

《资源描述与检索》(RDA)一统江湖? (2006-04-16)
/posts/20060416102200.html
RDA与代表出版业书目记录标准的ONIX成立联合创新活动。

RDA联机版原型演示及调查 (2006-07-04)
/posts/20060704213548.html

RDA:20世纪的编目规则 (2007-01-23)
/posts/20070123222009.html
Karen Coyle和Diane Hillmann发表文章,质疑RDA。

ALA 2007仲冬会议上的RDA:Barbara的态度 (2007-01-24)
/posts/20070124201348.html
代表LC的RDA编者Barbara B. Tillett对前述质疑的某种回应。

FAST: 主题词分面应用

    远洋过客在“Web化DDC·浏览LCSH”下留言,提示比“浏览LCSH”更早网络化LCSH的FAST项目。看后本想恶补一番,最终只略微进了点补,先踩个脚印。

    OCLC在多年前开始对LCSH进行分面处理,把先组定组式的标题表,拆分成各个“面”的主题词,直接使用而无需在标引时构造,所用词仍与LCSH兼容。项目名为“主题词分面应用”,简称FAST(FAST: Faceted Application of Subject Terminology)。研究组成员以Edward T. O’Neill为首,除了另外一些OCLC人员外,还有肯塔基大学的Lois Mai Chan和LC的Lynn El-Hoshy。O’Neill 还负责/参与OCLC与VIAF(虚拟国际规范档)和FRBR相关的研究。

介绍:
    在项目主页(http://www.oclc.org/research/projects/fast/)上可见FAST的最早报告是在2001年的IFLA年会预备会上(2001/8/14-16),最新报告是在2006年ALA会年上(2006/4/24)。
    这份报告作者Ed O’Neill和Lois Mai Chan,题名"A Faceted LCSH Based Subject Vocabulary",标明是OCLC与LC的合作研发项目。

背景(需要新方法):电子资源茁壮成长、元数据方案大量涌现、需要主题访问新方法、缺乏技术熟练的主题编目员
要求(Web环境下的主题词表):优化检索点,简单的结构与句法,可由非编目员在非图书馆环境下使用,语义互操作,兼容MARC、DC及其他通用元数据方案,易于维护,适合计算机辅助规范控制。

什么是FAST:一个基于LCSH术语的丰富控制词汇表,简化的应用句法。
FAST的原则:根据功能对标题进行分类的分面方法;以简单的应用句法保持LCSH词汇的丰富性;提供多层次方法,允许不同层次的主题表达。
FAST特征:
词汇:同一分面中的术语──枚举;不同分面中的术语──分列
检索:同一分面中的术语──先组;不同分面中的术语──后组
八个分面:论题、地理、形式(体裁)、时序、个人名称、团体名称、会议、统一题名(后二者尚未完成)
FAST优点:标题构造在词汇表中而非在应用层;适应先组与后组标引与检索;适用于计算机辅助标引与规范控制;比高度枚举式词表维护更方便经济;便利主题数据与跨领域检索的匹配;适应不同检索模型。

试用:
    FAST规范文档的使用界面名为测试数据库(OCLC FAST Test Databases),入口位于:http://fast.oclc.org/。该处还链接有名为《FAST应用指南与文献》的手册草稿(PDF, 484K, 80p. 发布日期2007-1-12)。
    进入测试库后可以看到数据库的进展,论题、个人名称主题、团体名称主题、地理、时期、题名、事件、体裁已完成,仅参照记录进行中,看来这一年进展顺利(“会议”属“事件”)。
    以前曾试用过,当时还没有写博,故而也没有留下记录。这次再用,想起上次使用的感觉──无法作为编目辅助工具使用。系统应该不是为人查用的,既没有前方一致查询,也没有精确查询,要确切地查到一个词并不容易。如在论题中查“information”,用高级检索,命中达2533条,且按首字字顺显示结果,以information起首的主题词出现九百条之后;由于information本身并非主题词(不够精确以至不足以作为主题词?),无论在主标题(Main Heading)还是副标题(Subdivision)中查,检索结果都为0。
    原以为FAST后将标题表改成了后组的叙词表,其实FAST本身有相当数量的先组词,如记录号为fst00801549的“Agriculture–Information services–Public opinion”,就由三部分组成(如前述PPT所述,属同一个“面”?)。从前述PPT看,标引时没有LCSH的浮动表之类需要在使用时构造主题词,而是列举出所有主题词,因之也不是叙词表。如果从句法上看,属元词表。

    项目主页上还列有ALA 2006年会上另外两个报告,其中一个是杨百翰大学Shannon Hoffman的"Looking Deeper into Using FAST: Report on three projects using the FAST Authority File"(ppt:97K/13 slides),介绍FAST在三个项目中的应用,他的结论是两个:1、FAST需要改进检索;2、要非编目员作主题分析并达到一定的专指度,需要加以培训。
    想来他的想法与我一致,FAST设想的“非编目员在非图书馆环境下使用”的目标并不容易达成。

附:FAST常用字段
FAST采用MARC21规范格式,一些字段说明:
001 FAST记录号(fst……..)
043 地理区域代码
100/400 FAST个人名称
110/410 FAST团体名称
111/411 FAST事件(含会议)
130/430 FAST题名
148/448 FAST时序名称
150/450 FAST论题
151/451 FAST地理名称
155/455 FAST载体
688 一般有两条,分别是LC和WC中的使用频次,很有意思的数据
7XX 对应LCSH ($0 LCCN,如(DLC)sh YY……)

理解元数据标准类型之CNMARC版

    常见谈元数据标准的,感觉是越来越复杂、越听越糊涂,尤其不明白冒出来的“应用纲要”到底是什么,与元数据标准的关系如何。今天见到远洋过客的“理解元数据标准的类型,标准规范不再复),似乎茅塞顿开。正确与否不论,先按自己的理解画示意图一幅:
 元数据注册系统
(此图于2007-11-20根据远洋过客留言更新)
    再做一个通俗版,中文编目为例帮助理解:
元数据元素集是CNMARC;
数据取值除了照录的,依据的词表有《中图法》、《汉语主题词表》、代码表(如出版地、语种等),以及一些格式规定(如年代取公元年);
据(著录)内容由《中国文献编目规则》决定;
各类文献的著录细则(可能结合MARC字段)属于应用纲要;
数据交换格式现在采用ISO2709,未来可能采用ISO25577(marcXchange)
编目时由软件将交换格式转换成编辑格式,不同类型文献有不同的模板(schemas),产生不同的工作单。 
(静候远洋过客、Keven及各位指正)