由OCLC TOP 1000想到的

    Lorcan Dempsey推荐2005新版的OCLC TOP 1000――OCLC成员馆收藏最多的1000种文献。这篇“Top 1000 works”从标题开始就一直在强调“作品”――集中不同的版本与译本。在FRBR深入人心的情形下,很吸引人。

    去年OCLC首次编制TOP 1000,自己当时凭直觉以为是按各书目记录下的馆藏数从多到少排列得出的,全然没有注意前面的说明,是通过全球图书馆的“购买投票”评出的值得收藏的智力作品(the intellectual works that have been judged to be worth owning by the “purchase vote” of libraries around the globe)。今天仔细看TOP 1000,发现在书名、作者下,有二个数字,分别是Library holdings(馆藏数)和Bibliographic records(书目记录数)。既然是图书馆收藏最多的排行榜,排序当然是以“馆藏数”为依据的。但这是由同一作品的不同书目记录下的馆藏合计而成的。我原来忽略了“智力作品”一词,把在现有书目数据库状态下相当复杂的集中同一作品的算法,看成一个简单的排序,实在是极可笑的。

    大致比较新、旧两个版本的TOP 1000,发现一个奇怪的数据变化。《圣经》由去年的第二上升到第一,原没什么,奇怪的是数值的变化:
                         2004      2005    变化
Library holdings:       271,534  796,882  2.9倍
Bibliographic records:  36,738    93,567  2.5倍

从上述数据来看,如果说图书馆忽然想起来,一窝蜂购买大量《圣经》,这种解释已经很勉强;如果说全世界的出版商忽然想起来,一窝蜂在一年内出版几万种《圣经》,差不多可以说是笑话。可能增加的有部分回溯的旧书目数据,但数据变化如此之大,只能认为是算法变化所致。也就是说,OCLC进一步改进了它集中同一种“作品”的算法,包括了更多原来未视作同一作品的书目记录。这本身就是OCLC的财富,也是它雄霸图林天下的资本之一。

乱弹一篇:
    Lorcan还推荐TOP 1000的副产品“Fun factsabout the updated OCLC Top 1000。其中有一段关于TOP 1000中出版次数最多的作品,一至四位分别是:《圣经》,《哈加达》(犹太教《圣经?旧约》故事),《神曲》和《古兰经》。看着这几部书,四大宗教,独缺佛教。仔细想想,佛经众多,却并没有一部象《圣经》、《古兰经》那样所有教徒都熟诵的至上经典。佛教徒也如佛教经典一般四分五裂,因之与其它宗教相比,终是处于弱势。

 

维基版的OPAC什么样?

    5月的时候,OCLC的首席科学家Thomas B. Hickey在他的博客Outgoing上,向大家披露OCLC的WorldCat Wiki计划,用维基――也就是众人的力量――完善WorldCat。人们可以给相关的书目记录加上评论、封面、注释等。
    最近看到LISNews消息“Wiki WorldCat (WikiD) Pilot From OCLC”,说OWC在9月开始了其联合目录的维基试验计划,并提供了计划的网址:http://www.oclc.org/productworks/wcwiki.htm

    计划说明图文并茂,可以一窥维基版OPAC的概貌。具有维基功能的主要是以下三个部分:
Reviews:给文献添加评论,看别人写的评论
Edit table of contents:编辑目次
Notes:给文献加注释

    图示中以小说《达芬奇密码》为例。但截止目前,通过OWC查同样ISBN的这部小说,还看不到维基功能。
    对比OWC检索结果与计划中的图示结果,计划图示中有“My Account”,而OWC没有,而且计划图示以Columbus Metropolitan Library作为Lance Osborne这个用户的“My Library”。
    维基最麻烦的问题就是涂鸦,是否OWC的Wiki以注册用户才能参与写作的方式予以某种程度的控制呢?是自己直接管理用户,还是借助于成员图书馆的用户认证?计划主页没有说明。查Columbus Metropolitan Library的OPAC,也没有看到与OWC的链接。

    在现在的OWC,没有看到维基功能,倒是看到了editions――将同一文献不同版本(包括语种、载体等)集中在一起。这个功能以前是没有的,不知道这种变化始于何时。FRBR在OPAC的应用,在集中同一文献的不同版本这一点上,基本上已形成共识。OCLC以往的许多FRBR试验,归结到OWC中,现在就只看到“版本”这个标签了。

    计划说明,联合目录的维基未来会由OWC扩展到WC。这么麻烦增加维基功能,目的为何?“将OCLC编目合作扩展到非编目图书馆专业馆员与用户。帮助成员馆鼓励、吸引与管理其本地用户群的输入,引起他们对图书馆内容的兴趣。通过OCLC的合作方式的益处在于,使每一成员可以访问所有成员的内容,在WorldCat内部建立起一个社区的感觉。”
    吸引用户参与、增加服务的粘度,是Web 2.0时代最重要的因素了。以往的OPAC是单向的,由图书馆向用户提供书目信息,现在,用户也可以在书目信息中加上自己的看法、补充书目中缺少的信息、随时更正错误的信息。其实维基在这里只不过是一种工具――当然是一种不错的编辑工具。   

参见OCLC首席战略家、研究部副总裁Lorcan Dempsey的博客文章:
“让数据起作用――Web 2.0与图书馆目录”(Making data work – Web 2.0 and catalogs

更新(2005-10-10):
Lorcan在上文中说维基在周末可用。计划的网页是说9月开始的,我耐心地等了几日,到了中国周末的晚上(还只是美国的早晨呢),还是太心急了一点。Lorcan在9日的博客中宣布已经可用(Putting the Wiki in OpenWorldCat)。现在点击上文中《达芬奇密码》的OWC实例,已经可以看到。
Lorcan文后的第一个评论者说:维基功能在哪儿?不就是亚马逊的那些东西,可从没有听说那些功能被称作维基。

 

曹宁“试论FRBR在中国文献编目规则和机读格式中的应用”笔记

    编目条例制订者煞费苦心,但并没有把其良苦用心告知使用者,使用者既不能知其所以然,有时就不免觉得规则莫名其妙。作为新版《中国文献编目规则》的副主编,作者“试论FRBR在中国文献编目规则和机读格式中的应用”一文多少揭示了内中的一些玄机,看得比较过瘾。

    本文第一部分“FRBR的概念模型”为扫盲。

    揭示玄机的是第二部分“从FRBR角度分析《中国文献编目规则》修订过程中的几个难点问题”。

(1)对文献获得方式的界定
    “按照FRBR的解释,获得方式是载体表现的特殊属性,除此之外它不属于其他任何一个层面上的实体”。因此,“获得方式通常是指由文献提供者确定的具有普遍意义的获取方式,而不应该是由文献所有者确定的特殊性的获取方式。”
    或者说,获得方式不属于Item(作者译为“对象文献”)层面。

(2)古籍著录中复本附注的应用
    “将古籍著录的对象固定在以版本版刻为主要特征的文献载体表现的层面上”,印次、复本属Item,用附注加以说明。如此古籍著录规则“与《规则》总则以及ISBD(A)取得了一致”。

(3)版本信息的区分及著录方式的选择
    “那些由文献出版者赋予的版本信息(对中文普通图书而言,一般集中出现在版权页)大多可以著录在版本项,而那些由文献创建者或实现者赋予的版本信息(对中文普通图书而言,一般集中出现在书名页)则要慎重考虑著录在何处。”前者为内容表达,后者为载体表现?
    文中很谨慎的说出现在书名页的版本信息“要慎重考虑著录在何处”,而没有直接说“大多可以著录在题名与责任者项”。因为新版《中国文献编目规则》中的如下实例(第37页例6)无疑是有很大争议的:

中国图书馆分类法(第四版) / 中国图书馆分类法编辑委员会编

《中图法》第四版由于“第四版”出现在题名页,版权页题“第1版”,故新版《规则》认为其题名是《中国图书馆分类法(第四版)》,而非一般认为的题名是《中国图书馆分类法》、版本为第4版。

(4)标目法中个人和团体名称检索点选取原则的确定
    “文献标目的主体对象明确限定在著作和内容表达层面,同时也为揭示载体表现和对象文献层面的特例提供了可能”。

    第三部分“FRBR概念模型在编目规则和机读格式中实现的可能方式”是作者的一些设想。主要是以FRBR思想处理统一题名。以莎士比亚的《哈姆雷特》为例,举了常见的FRBR结构(w-e-m),还有:

书目记录(载体表现层)。除500统一题名形式外,与普通书目记录无异。
规范记录(内容表达层)。有点奇怪,规范记录做到了译者这一层。
规范记录(著作层)。除一般题名规范记录的内容外,还包括分类和主题。

    作者说是受LC芭芭拉女士“AACR3:资源描述和检索”一文的直接启发。芭芭拉此文我尚未看过,看过她在5月FRBR研讨会上的PPT“FRBR与编目规则:对IFLA的原则声明与AACR/RDA的影响”,其中有规范、书目、馆藏三层与FRBR实体间的对应关系图示。
    如作者所说,“FRBR研究的第二个目的是为了倡导文献编目的简化,提高编目效率,节约编目成本”。所举著作层的规范记录,包括了原本需要在每条书目记录中重复的分类与主题,可以说达到了这一目的。但内容表达层规范记录做到译者这一层次,是否做得过多?对照LC,对Hamlet也只做了少数语种(而非全部语种)的规范记录,而没有具体到译者。难道FRBR应用的结果,就是要我们多做N条规范记录?
    不过还有,“如果一种著作只有惟一的载体表现,则各层实体的全部信息都反映在载体表现层的书目记录中,而不需要制作著作/内容表达层的规范记录”。原本题名规范记录即遵循此准则。那么如果某译本(内容表达)只有惟一的载体表现,是不是也无需做内容表达层的规范记录?

原文出处:中国图书馆学会2005年年会征文优秀论文集
中国图书馆学会编《以人为本 服务创新》(北京图书馆出版社2005,317-324页)

原文参考文献之一:
Barbara Tillett. AACR3: Resource Description and Access.
http://www.collectionscanada.ca/jsc/docs/aacr3pptjan2005.pdf

芭芭拉的另一个PPT:
Barbara Tillett. FRBR and Cataloguing Rules: Impact on IFLA’s Statement of Principles and AACR/RDA. (
PPT: 862 KB/49 slides)