若有所思 – 第 254 页

编目未来

    一个月前，参加上海市文献联合编目中心第六届年会，在会上做了个发言：“编目的发展趋势：关于编目未来的思考”。“骗骗他”在此，其中提出四个发展趋势：
        编目格式简单化
        编目外包普遍化
        数据来源多样化
        联合目录本地化
    上述观点暂归本人版权所有，已化成论文投稿，已蒙引用，敬请注明出处。

对编目未来思考的结果是很悲观的，那么编目员的未来呢？PPT中的结论是编目员成为数字图书馆员。
本人亲身体会，编目知识还是很有用的（虽然并不是都有用）。于良芝说图书馆职业可以不在图书馆工作，秦健告诉了我们图书馆的新职业──元数据编目员（metadata cataloger），所以编目员不会没有未来。

参见：
编目员成为数字图书馆员 (2004-11-29)
老槐也博客：LIS核心课程：理论、原理、实践、价值观

《书目控制未来报告》（草案）解读

美国国会图书馆(LC)的书目控制未来工作组(http://www.loc.gov/bibliographic-future/)于11月30日发布了《书目控制未来报告》草案(PDF, 315KB)。这几天到杭州做CALIS联机合作编目中心的西文图书编目培训，每晚拿着打印件认真研读。之前Karen Coyle的直播报导基本反映了草案的内容，看文本另有一些感受。

文首没有一般报告的铺陈，可谓开宗明义，“书目控制未来将是合作的、去中心化的、国际范围的、基于WEB的。它的实现将出现在与私营机构的合作，与图书馆用户的积极协作。数据将从不同来源获取，变化将迅速出现，书目控制将是动态的而非静态的。”(p.1)

阅读时最强烈的感受是，文中处处表明，在书目控制领域，曾经制定并维护了众多标准、提供了大量高质量书目与规范记录的LC，已不想再做老大(alpha library)（“去中心化”），只想做一个普普通通的联合编目成员馆（“合作”）。LC强调，它并非国家图书馆，所以不应当承担国家图书馆的上述责任(p.3)。当然LC是一个负责任的机构，不会立马撒手不干，这是报告三大指导性原则之一“重新定义LC的作用”部分要说明的内容(p.9)。
比较受鼓舞的是，LC将在WEB平台上更多地开放其内容。

作为曾经的编目员，正做着细致的编目培训，感受最深的是三大指导原则之首“重新定义书目控制”中的这段话：“单一环境如图书馆目录中描述(著录)的一致性，与各种环境间进行连接的能力相比，正变得不那么重要：Amazon到WorldCat到Google到PubMed到Wikipedia，图书馆馆藏只是其中的一个节点。在今天的环境下，书目控制不能再被看作局限于图书馆目录。”(p.7)
报告似乎吹响了抛弃MARC的号角，3.1.1建议“开发一个更灵活可扩展的元数据载体”，兼容WEB技术与标准，不限于图书馆数据实践。而系统供应商也将开发能够接受不同格式元数据的产品。(p.22) 有一些不能理解的是，报告称图书馆的元数据环境太复杂，检索协议环境也很复杂(p.24)，不说这些标准多由LC主导或参与，如果再开发一个，岂不更增加其复杂性？

有一帮FRBR的粉丝，之前看到直播报告后，对于报告草案中“重新认识FRBR”中的一些说法很是不满。看过报告，发现其实LC还是很认可FRBR的，希望应用不限于“作品级”，并能够真正实用(p.28-30)。
LC真正不满的是RDA，不满者有四(p.24)：
·在讫今为止的草案中看不出RDA所承诺的益处；
·不清楚根据RDA创建的元数据如何与现有元数据一致；
·转向RDA的工作方式不令人满意；
·采用RDA在改变工作流程与配套系统方面所需财力将被证明相当大
RDA原定2008年发布，从本草案看是2009年发布了，如果暂停(p.25)，就不知何时了。10/22，JSC网站上刚公布了包括LC在内的英国、加拿大、美国、澳大利亚四个国家图书馆将在2009年前共同实施RDA的新闻（http://www.collectionscanada.ca/jsc/rdaimpl.html），不知道当初LC的代表(Barbara B. Tillett?)是不是具有代表权。直播当天她提了一个问题，似乎并未涉及此点。

其实在美国关于书目未来的争论还有一个重要的背景，就是编目专业人员的青黄不接(p.4)。报告表明，近三十年来，由于套录成为普遍现象，一直觉得对编目专业人员的需求会下降。而现在则面临编目员的大量退休，有素质的教学人员也变得稀缺(p.34)。所以报告的最后部分专门讲到要为今后的需求设计图情教育（包括网络课程），并且需求似乎在从图书馆转向信息业。[i.e./e.g.图书馆外包编目，编目员不再在图书馆工作，而在外包公司工作]

P.S. 博文写完，朋友建议将此主题写成论文。我想还是等2008/1/9“最终报告”发布以后吧。

update: 黄昏时才到家。因为外出不上网，数日未看博文。将陆续链接国内相关报道：
书蠹精：书目控制的未来 (2007-12-01 16:05:24)
http://blog.sina.com.cn/s/blog_495d626401000b98.html
Keven：简评“书目控制的未来”报告草案 (2007-12-1)
http://cnlib20.ning.com/forum/topic/show?id=509559%3ATopic%3A9862

关于书目控制未来工作组，参见：
书目控制未来工作组：关注2007年11月 (2006-12-12)
/posts/2006/1212/527

书目控制未来工作组会议：用户与使用 (2007-03-10)
/posts/2007/0310/491

书目控制未来工作组报告草案网络直播 (2007-11-18)
/posts/2007/1118/398

关于RDA，参见：
AACR终于准备出第3版了 (2005-01-13)
/posts/2005/0113/727
AACR3，副题名"Resource Description and Access"。计划出版日期2007年。

“英美编目条例”退出舞台：从AACR到RDA (2005-07-31)
/posts/2005/0731/761
AACR3不见了，正题名变成了原副题名的缩写RDA。出版日期推迟到2008年。

《资源描述与检索》(RDA)一统江湖？ (2006-04-16)
/posts/2006/0416/878
RDA与代表出版业书目记录标准的ONIX成立联合创新活动。

RDA联机版原型演示及调查 (2006-07-04)
/posts/2006/0704/881

RDA：20世纪的编目规则 (2007-01-23)
/posts/2007/0123/509
Karen Coyle和Diane Hillmann发表文章，质疑RDA。

ALA 2007仲冬会议上的RDA：Barbara的态度 (2007-01-24)
/posts/2007/0124/508
代表LC的RDA编者Barbara B. Tillett对前述质疑的某种回应。

FAST: 主题词分面应用

远洋过客在“Web化DDC·浏览LCSH”下留言，提示比“浏览LCSH”更早网络化LCSH的FAST项目。看后本想恶补一番，最终只略微进了点补，先踩个脚印。

OCLC在多年前开始对LCSH进行分面处理，把先组定组式的标题表，拆分成各个“面”的主题词，直接使用而无需在标引时构造，所用词仍与LCSH兼容。项目名为“主题词分面应用”，简称FAST（FAST: Faceted Application of Subject Terminology）。研究组成员以Edward T. O’Neill为首，除了另外一些OCLC人员外，还有肯塔基大学的Lois Mai Chan和LC的Lynn El-Hoshy。O’Neill 还负责/参与OCLC与VIAF(虚拟国际规范档)和FRBR相关的研究。

介绍：
在项目主页（http://www.oclc.org/research/projects/fast/）上可见FAST的最早报告是在2001年的IFLA年会预备会上(2001/8/14-16)，最新报告是在2006年ALA会年上(2006/4/24)。
这份报告作者Ed O’Neill和Lois Mai Chan，题名"A Faceted LCSH Based Subject Vocabulary"，标明是OCLC与LC的合作研发项目。

背景（需要新方法）：电子资源茁壮成长、元数据方案大量涌现、需要主题访问新方法、缺乏技术熟练的主题编目员
要求（Web环境下的主题词表）：优化检索点，简单的结构与句法，可由非编目员在非图书馆环境下使用，语义互操作，兼容MARC、DC及其他通用元数据方案，易于维护，适合计算机辅助规范控制。

什么是FAST：一个基于LCSH术语的丰富控制词汇表，简化的应用句法。
FAST的原则：根据功能对标题进行分类的分面方法；以简单的应用句法保持LCSH词汇的丰富性；提供多层次方法，允许不同层次的主题表达。
FAST特征：
词汇：同一分面中的术语──枚举；不同分面中的术语──分列
检索：同一分面中的术语──先组；不同分面中的术语──后组
八个分面：论题、地理、形式（体裁）、时序、个人名称、团体名称、会议、统一题名（后二者尚未完成）
FAST优点：标题构造在词汇表中而非在应用层；适应先组与后组标引与检索；适用于计算机辅助标引与规范控制；比高度枚举式词表维护更方便经济；便利主题数据与跨领域检索的匹配；适应不同检索模型。

试用：
    FAST规范文档的使用界面名为测试数据库(OCLC FAST Test Databases)，入口位于：http://fast.oclc.org/。该处还链接有名为《FAST应用指南与文献》的手册草稿（PDF, 484K, 80p. 发布日期2007-1-12）。
    进入测试库后可以看到数据库的进展，论题、个人名称主题、团体名称主题、地理、时期、题名、事件、体裁已完成，仅参照记录进行中，看来这一年进展顺利（“会议”属“事件”）。
    以前曾试用过，当时还没有写博，故而也没有留下记录。这次再用，想起上次使用的感觉──无法作为编目辅助工具使用。系统应该不是为人查用的，既没有前方一致查询，也没有精确查询，要确切地查到一个词并不容易。如在论题中查“information”，用高级检索，命中达2533条，且按首字字顺显示结果，以information起首的主题词出现九百条之后；由于information本身并非主题词（不够精确以至不足以作为主题词？），无论在主标题(Main Heading)还是副标题(Subdivision)中查，检索结果都为0。
    原以为FAST后将标题表改成了后组的叙词表，其实FAST本身有相当数量的先组词，如记录号为fst00801549的“Agriculture–Information services–Public opinion”，就由三部分组成（如前述PPT所述，属同一个“面”？）。从前述PPT看，标引时没有LCSH的浮动表之类需要在使用时构造主题词，而是列举出所有主题词，因之也不是叙词表。如果从句法上看，属元词表。

项目主页上还列有ALA 2006年会上另外两个报告，其中一个是杨百翰大学Shannon Hoffman的"Looking Deeper into Using FAST: Report on three projects using the FAST Authority File"(ppt:97K/13 slides)，介绍FAST在三个项目中的应用，他的结论是两个：1、FAST需要改进检索；2、要非编目员作主题分析并达到一定的专指度，需要加以培训。
想来他的想法与我一致，FAST设想的“非编目员在非图书馆环境下使用”的目标并不容易达成。

附：FAST常用字段
FAST采用MARC21规范格式，一些字段说明：
001 FAST记录号(fst……..)
043 地理区域代码
100/400 FAST个人名称
110/410 FAST团体名称
111/411 FAST事件（含会议）
130/430 FAST题名
148/448 FAST时序名称
150/450 FAST论题
151/451 FAST地理名称
155/455 FAST载体
688 一般有两条，分别是LC和WC中的使用频次，很有意思的数据
7XX 对应LCSH ($0 LCCN，如(DLC)sh YY……)