伪书的图书馆收藏及编目

    日前新闻出版总署公布19种含有虚假信息图书,要求书店停售。这里的“虚假信息”含意不明,是夸大宣传,抑或子虚乌有的杜撰?似乎后者的可能性较大,即为假冒书。相比1月北京锡恩企业管理顾问公司提出的百来种管理类伪书(消息清单)这个数字要少很多。
    图书馆应当如何处理此类图书?“續 採編的新挑戰:偽書的陷井”,认为图书馆收藏伪书存在以下问题:
1、與圖書館精神的抵觸(主要从知识产权角度,但没有排除图书馆出于典藏目的的收藏。)
2、圖書館應提供正確的資訊給讀者
3、與圖書館社會教育的功能不契合
4、圖書館信任度的影響

    伪书古已有之,现今某些经典就被疑为伪书;就比例而言,也未必于今为盛(梁董提供了古籍中伪书的数据,但结论十分之一当为百分之一误)。出版伪书固可指责,但图书馆收藏则未必。如非侵权,只是托伪之作,则与知识产权无涉。除少儿图书馆,读者均是成年人,有自己的判断力,图书馆是否真有教育职能,也大可质疑。相反,图书馆具有保存文化(哪怕是负面的)之作用,收藏伪书无可厚非。至于是否应当限制使用,则应当区分不同情况,如不涉及知识产权问题,应当可开放使用。
    无论如何,如果作为馆藏,图书馆有必要通过目录告诉读者该书之真伪(即“提供正确的资讯给读者”),而由读者自行决定是否需要阅读此书。

    虽然编目员通过一番查证,有时能够对某些书的真伪作出正确的判断,然而这种判断缺乏权威性,容易受到质疑。有新闻出版总署的尚方宝剑,自然就无后顾之忧了。
    曾写过“伪书之假冒外版书”,当时老槐在评论中曾考问关于伪书的“编目理论”和“现代编目原则”。当时我的回复不知为何无法提交。伪书新闻重现,我再将此问题认真查考一番,或许可采取如下做法:

    按照著录规则,在题名与责任者项仍应照录,但标目则另当别论。《中国文献编目规则》没有提及这种情况,AACR2R(2002之21.4C)或《西文文献著录条例(修订扩大版)》(9.2.1.3)有关于“误认或虚构为某个人或团体的作品”的规定。对于个人的规定如下:
    如果知道实际著者,以实际著者作为主要款目标目;如果查不到真实的著者,则以题名作为主要款目标目,为虚构或误认的著者作附加款目。
    虽然中文编目没有主要款目概念,但这个规定对于中文伪书也可套用。那些子虚乌有的书,或可认为实际上是(编)译者之作,故应以(编)译者为主要或等同知识责任(701字段),而以杜撰的原作者为次要知识责任(702字段)。考虑到作伪或有所顾忌,(编)译者很可能只是个笔名,这不影响其作为一个检索点。
    文献语种(101字段)当为原作或编译,而非翻译。当然,宜加附注说明该书为伪书。

疑惑:
    在多种图书馆目录或联合目录中,查新闻出版总署的伪书,《强者怎样诞生》说明为国际文化出版公司出版,但只查到中国长安出版社出版的;而《管理史上的奠基之作》说明为中国长安出版社出版,却只查到中国纺织出版社出版的。
    《没有任何借口》有真假两种版本已是尽人皆知的了。那么,是否上述二书也如此?以该二出版社出版伪书的肆无忌惮、习以为常,似无可能。

书目记录四种实体的汉译

    《书目记录的功能需求》(FRBR)将书目数据用户感兴趣的关键对象称作实体,分成三组,即产品、责任与主题。其中“产品”在《国际编目原则声明(草案)》中被称为书目记录的实体,而所有三组均为规范记录的实体。

    作为书目记录实体的产品,包括四个层次:workexpressionmanifestationitem。对于后三项如何翻译,我开始学习FRBR时很是斟酌了一番,最后将这四个层次译为“作品――表达――表现――文献单元”。后来发现中间二个与王绍平、王松林的翻译正好相反,只好试着转过来。但对于work,因为包含的不仅是著述,也包含艺术创作,所以觉得“作品”比“著作”更合适。
    不料,看到挂在《国际编目原则声明(草案)》官方网站的林明、王绍平、刘素清最新译法,似乎又与我原来的译法相近了。现将不同译法归纳如下:

  work expression manifestation item
王绍平 著作 表现方式 表达形式 文献单元
王松林 著作 表现方式 表达形式 手边文献
林/王/刘 作品 内容表达 载体表现 单件
(本人) 作品 表达 表现 文献单元
日语 著作 表现形 体现形 个别资料

    以上日语取自《国际编目原则声明(草案)》的日译本。日译对此四个术语也使用了汉字,而不是他们流行的假名,可作对比参考。

    随着FRBR与“原则声明”影响的进一步扩大,这四个术语的使用将越来越普遍。不同汉译并存甚至互相对立,且各有拥趸者,显然不利于互相交流与沟通。林、王、刘的译法意义比较明确,作为大家今后采用译法应当是比较合适的。林、王、刘对work、expression、manifestation的译法意义比较明确,作为大家今后采用译法应当是比较合适的。而item的译法似仍有探讨的余地,因为item有可能是一套多卷书、一个套件kit之类,用“单件”易产生误解。(2005/5/21更新)

附:林明,王绍平,刘素清译“IFLA国际编目专家会议最终词汇表”对四种实体的定义:

  • 作品work:独有的知识或艺术的创作(对知识或艺术的内容而言)。
  • 内容表达expression:一部作品的知识或艺术表现。
  • 载体表现manifestation:一种作品之内容表达的物理体现。
  • 单件item:一种载体表现的单一样本。

相关文献:

  • 《书目记录的功能需求》(英语PDF文件
  • 《国际编目原则声明(草案)》(林明,王绍平,刘素清译,中译本PDF文件
  • 王绍平:编目工作的新观念、新方法――从《巴黎原则》到《书目记录的功能需求》(《图书馆杂志》2001年第9期)
  • 王松林:从AACR2的审议过程看描述性编目条例的未来(《图书馆学刊》2003年第1期)
  • IFLA国际编目专家会议最终词汇表(林明,王绍平,刘素清译,中译本PDF文件

 

亚马逊“书内搜索”扩展功能

    平时上亚马逊,只注意到那些在国内购书网站上常见的推荐相关图书的信息。那天看到OCLC首席科学家Lorcan Dempsey绕有兴趣地使用亚马逊的数据挖掘功能(Amazon: making data work),并预言这些数据可作进一步研究。于是再去看亚马逊的特色,前几天已经写了“Google与Amazon书内搜索比较”,今天再看看亚马逊由图书全文扫描所获数据延伸出来的其他功能。
    亚马逊部分图书(标记为Search Inside!)有全文电子版作为数据源,除“书内搜索”(Search Inside This Book)、“浏览样本页”(Browse Sample Pages)外,还提供了一些有趣或者精彩的功能,在Inside This Book栏目下有:

Statistically Improbable Phrases (SIPs)
    特色词组。亚马逊首创术语,由词频统计得出,某词组在该书中出现次数在所有“书内搜索”图书中相对较多。可由这些SIPs了解该书特色,前述Dempsey文章即围绕此一功能。
    如Cataloging and Classification for Library Technicians一书第一个SIP即nonfiling characters,可见该书对MARC格式解读之细致。
    还可点击SIPs了解采用该词的其他图书及在书中出现的频率。

Books on Related Topics
    相关论题图书。这里的“相关”判断利用的是两书相同SIPs的数量。

Concordance
    词频索引。依字顺排列最高频的100个词,由字体大小显示词频高低。比如,在亚马逊的几本编目图书中,以Manheimer&aposs Cataloging and Classification: Revised and Expanded最注重“规则”rule。

Text Stats
    文本统计,包括可读性、复杂性等。
    外国人有很多创新,而很多创新又是在充分利用前人已经完成的研究的基础上的。亚马逊的“可读性”就采用了几种早已有之的指数:

1、Fog Index
    阅读与理解一段文本所需的正规教育年限。
    以高中毕业12年(K-12)计算,一般专业书多在12以上,即要求大学水平。也有16以上的,那是硕士水平了。但是Library Research Models: A Guide to Classification, Cataloging, and Computers一书,题名虽为Guide,分值居然高达21,非博士不能读?
2、Flesch Index
    开发于1940年的一个指数,最高值100,分值越高越易读,0-30适合大学水平。
    想不到1940年就已经有文本分析可读性的量化研究。
3、Flesch-Kincaid Index
    Flesch Index的更改进版,也与教育年限相对应。
    对比了一些书的可读性指数,似乎lesch-Kincaid指数值都比Fox指数值低,如Library Research Models一书为18。

    “复杂性”中有一个指数是每个句子包含的词数,Library Research Models一书的此值为31.1,确实是个十分恐怖的数字。估计可读性计算也与此值有关。
    上面这些内容或许太严肃了些。亚马逊在最后提供了二个娱乐统计数据
每1美元可买多少个词(买家看看值不值)
每1盎司有多少个词(大概因为邮寄按重量计费,所以亚马逊数据库中才会有图书重量数据)

    Dempsey感兴趣的The Rise of the Network Society一书还有引文功能(Citations),包括引用与被引。该书引用了199本书,又被230本书引用。引用来源图书似有重复,且由于数据原因,仅限亚马逊“书内搜索”图书。
    “引文”也是亚马逊书内搜索中值得进一步关注的功能。

另:亚马逊有一些标记为“Look Inside”的图书,如“The Intellectual Foundation of Information Organization”,没有“书内搜索”及扩展功能,只有“浏览样本页”功能:封面、封底、目次、版权页、片断(通常为图书起始部分)、索引等。