本馆网站改版:2.0与1.0

最近本馆网站改版,增加了一些2.0的元素。首先是把“浏览器工具条”挂上了首页。之前曾请同事们试用,根据反馈及自己的体会,一直在不断地调整更新,这次算是面向读者了。其次是推出了“新书通报RSS服务”,技术部同事做的,借鉴了上海大学的形式,可以选择《中图法》二级类、输入多种关键词,在我看来做得非常棒。
这些小玩意儿,做的时候并没有做过读者调查,不知道读者是不是知道浏览器工具条,有没有安装过如Google工具条之类的浏览器插件,或者如花生壳在QQ群里问的那样,是不是愿意再装一个图书馆的工具条。也不知道读者是不是知道RSS,有多少读者在使用RSS阅读器,需不需要新书通报,是不是希望以RSS方式获取自己定制的新书通报。如此等等一大堆的问题。
过些天打算向读者做些推广,一段时间以后,再看使用效果。

网站是永远的beta版,所以仍在不断地小修小补,昨天在修订“民国书刊查阅指南”。以前这个指南曾经打印成纸,也曾通过邮件发送给需要的读者。因为了解到有一定的需求,所以早早让它在“图书馆工具条”上占了一席之地,趁改版又在首页挂了个链接。
指南是我在网上搜罗、试用后的结晶,按朋友的说法是可以投到期刊上发表的。包括以下几个部分:

1、国家图书馆“馆藏精品”
(1)民国期刊
(2)民国图书
(3)民国法律文献
2、中美百万册图书项目(CADAL)
3、超星数字图书馆
4、本馆书目系统
5、馆际互借

写的时候是想着指引本馆读者如何在网上寻找民国书刊全文,自以为很为读者着想的,不过昨天修订时却横竖看着不顺眼:为什么图书馆知道有这么多资源可以利用,却不能提供一站式的获取途径,而要读者到六七处地方去搜寻?
不过要做这事,就不像工具条、RSS推送那么简单了。因而需要有“规划”,否则只能是面对1.0的现实,空有2.0的理念而已。

工具条参见:
定制浏览器工具条 & 定制RSS源 (2006-08-01)
制作图书馆的浏览器工具条 (2007-03-13)

民国书刊参见:
电子版民国图书和期刊 (2006-09-27)
百万图书”项目(CADAL)相关信息 (2006-12-18)
国家图书馆民国电子书 (2007-06-26)
国家图书馆民国期刊全文下载方法 (2007-10-18)
(数图十年会上最新消息:国家图书馆将把所有数字化的文件都转成PDF/JPG格式的,这种下载方法有效期不会太长了)

骗骗他:数图十年

    刚过去的周一周二(2007/11/26-27),在深圳召开了“2007数字图书馆建设与应用研讨会暨成果展示会(中国数字图书馆十年:回顾与展望)”。
    入道也晚,对“数图十年”没什么概念,看图有其表之前发表的“中国数字图书馆十年回顾”,才知道2年前就已经庆祝过数图十年了,《数字图书馆论坛》2006年初还做了一期《我国数字图书馆十年回顾专刊》。
    竹帛斋主会前发文“数字图书馆的天敌:沉痛哀悼数字图书馆十年之娱乐不搞笑版”,或许会有偏题之感,却真的不是搞笑。全国有多少图书馆,每年花数十、数百万RMB付诸数据库商而不能保证来年的访问,这钱,真的只被当成了“数字”。不过斋主的会议致辞,一致认为还是很正统的。
    无缘与会,幸而有厦大及招募的志愿者现场直播,得以在网上磳会。因为远程与会,一边工作一边听会,效果自然大打折扣。并且对数字图书馆,至今仍是个门外汉,弄到最后印象最深的竟然只是一个新名词“骗骗他”。竹帛斋主自然也不肯放弃这么好的术语,在“大狗狗啃了我的数字图书馆手稿”中立马用上了。
    “骗骗他”者,PPT也。会议网站上有大部分的“骗骗他”。

FAST: 主题词分面应用

    远洋过客在“Web化DDC·浏览LCSH”下留言,提示比“浏览LCSH”更早网络化LCSH的FAST项目。看后本想恶补一番,最终只略微进了点补,先踩个脚印。

    OCLC在多年前开始对LCSH进行分面处理,把先组定组式的标题表,拆分成各个“面”的主题词,直接使用而无需在标引时构造,所用词仍与LCSH兼容。项目名为“主题词分面应用”,简称FAST(FAST: Faceted Application of Subject Terminology)。研究组成员以Edward T. O’Neill为首,除了另外一些OCLC人员外,还有肯塔基大学的Lois Mai Chan和LC的Lynn El-Hoshy。O’Neill 还负责/参与OCLC与VIAF(虚拟国际规范档)和FRBR相关的研究。

介绍:
    在项目主页(http://www.oclc.org/research/projects/fast/)上可见FAST的最早报告是在2001年的IFLA年会预备会上(2001/8/14-16),最新报告是在2006年ALA会年上(2006/4/24)。
    这份报告作者Ed O’Neill和Lois Mai Chan,题名"A Faceted LCSH Based Subject Vocabulary",标明是OCLC与LC的合作研发项目。

背景(需要新方法):电子资源茁壮成长、元数据方案大量涌现、需要主题访问新方法、缺乏技术熟练的主题编目员
要求(Web环境下的主题词表):优化检索点,简单的结构与句法,可由非编目员在非图书馆环境下使用,语义互操作,兼容MARC、DC及其他通用元数据方案,易于维护,适合计算机辅助规范控制。

什么是FAST:一个基于LCSH术语的丰富控制词汇表,简化的应用句法。
FAST的原则:根据功能对标题进行分类的分面方法;以简单的应用句法保持LCSH词汇的丰富性;提供多层次方法,允许不同层次的主题表达。
FAST特征:
词汇:同一分面中的术语──枚举;不同分面中的术语──分列
检索:同一分面中的术语──先组;不同分面中的术语──后组
八个分面:论题、地理、形式(体裁)、时序、个人名称、团体名称、会议、统一题名(后二者尚未完成)
FAST优点:标题构造在词汇表中而非在应用层;适应先组与后组标引与检索;适用于计算机辅助标引与规范控制;比高度枚举式词表维护更方便经济;便利主题数据与跨领域检索的匹配;适应不同检索模型。

试用:
    FAST规范文档的使用界面名为测试数据库(OCLC FAST Test Databases),入口位于:http://fast.oclc.org/。该处还链接有名为《FAST应用指南与文献》的手册草稿(PDF, 484K, 80p. 发布日期2007-1-12)。
    进入测试库后可以看到数据库的进展,论题、个人名称主题、团体名称主题、地理、时期、题名、事件、体裁已完成,仅参照记录进行中,看来这一年进展顺利(“会议”属“事件”)。
    以前曾试用过,当时还没有写博,故而也没有留下记录。这次再用,想起上次使用的感觉──无法作为编目辅助工具使用。系统应该不是为人查用的,既没有前方一致查询,也没有精确查询,要确切地查到一个词并不容易。如在论题中查“information”,用高级检索,命中达2533条,且按首字字顺显示结果,以information起首的主题词出现九百条之后;由于information本身并非主题词(不够精确以至不足以作为主题词?),无论在主标题(Main Heading)还是副标题(Subdivision)中查,检索结果都为0。
    原以为FAST后将标题表改成了后组的叙词表,其实FAST本身有相当数量的先组词,如记录号为fst00801549的“Agriculture–Information services–Public opinion”,就由三部分组成(如前述PPT所述,属同一个“面”?)。从前述PPT看,标引时没有LCSH的浮动表之类需要在使用时构造主题词,而是列举出所有主题词,因之也不是叙词表。如果从句法上看,属元词表。

    项目主页上还列有ALA 2006年会上另外两个报告,其中一个是杨百翰大学Shannon Hoffman的"Looking Deeper into Using FAST: Report on three projects using the FAST Authority File"(ppt:97K/13 slides),介绍FAST在三个项目中的应用,他的结论是两个:1、FAST需要改进检索;2、要非编目员作主题分析并达到一定的专指度,需要加以培训。
    想来他的想法与我一致,FAST设想的“非编目员在非图书馆环境下使用”的目标并不容易达成。

附:FAST常用字段
FAST采用MARC21规范格式,一些字段说明:
001 FAST记录号(fst……..)
043 地理区域代码
100/400 FAST个人名称
110/410 FAST团体名称
111/411 FAST事件(含会议)
130/430 FAST题名
148/448 FAST时序名称
150/450 FAST论题
151/451 FAST地理名称
155/455 FAST载体
688 一般有两条,分别是LC和WC中的使用频次,很有意思的数据
7XX 对应LCSH ($0 LCCN,如(DLC)sh YY……)