若有所思 – 第 295 页

FRBR影响之OPAC应用

G君问FRBR的影响体现在什么地方，从IFLA一心一意处处推广来看，这问题本身恐怕就是一篇论文很好的题材。

    今天在看一本Max Weber没有原题名的中文书，忽然想试试自己能否根据译名查到原名。韦伯是个高产作者，兼而有名，同一作品不断出版，还有不同译本。如果只有普通OPAC，结果怕有数百条，我是断无用OPAC查之念的。但因为之前用美国研究图书馆集团RLG的开放联合目录RedLightGreen（红绿灯）时，发现它对同一作品只提供一条检索结果，于是就用RedLightGreen试试。
    RedLightGreen检索界面如Google般简洁，输入“Weber, Max”，出现的结果（右栏）当然不是我所要的，应该是有关韦伯研究的作品。选左栏Authores中最前面的“Weber, Max 1864 1920”，得到20部韦伯的作品。如前文所述，由于规范控制不严，另有Weber, Max（19部）和Weber, Max, 1864 1920（6部），但基本包含在前面20部中（没有细作对比）。
    现在这只要在这20部中选择就可以了，问题简单不少。为了比较，后来我用LC与OhioLINK分别查了“Weber, Max”，结果分别是188条和429条记录。真令人望而生畏！
    RedLightGreen就是FRBR模型的一个非常有效的应用实例。想一下如果是读者，想知道韦伯究竟有多少作品，如果查本馆OPAC，或许结果数量不多，但得到的结果并不可靠；而如果查普通的大型联合目录OPAC，他试过第一次后，还会有耐心用第二次吗？

OCLC研究部也已做了多年的FRBR研究，其首席科学家Thomas B. Hickey在他博客的“FRBR Statistics”中说，最近在OCLC举行的FBRB研讨会上一个最共同的判断是，只有少数书目记录需要FRBR去聚合它们。并提供了最新的统计数据：WorldCat中，88%的作品只有一条书目记录。然而，如Cliff在评论中所说，对于有5900万记录的WorldCat来说，即使是少数比例的书目记录，绝对数也不是个小数字。

参见：（2005/5/14增加部分信息）
FRBR大本营（国际图联）
IFLA. Cataloguing Section. Functional Requirements for Bibliographic Records (FRBR) Review Group
http://www.ifla.org/VII/s13/wgfrbr/wgfrbr.htm

MARC与FRBR（美国国会图书馆）
MARC and FRBR
http://www.loc.gov/marc/marc-functional-analysis/

OCLC的FRBR研究
OCLC Research Activities and IFLA&aposs Functional Requirements for Bibliographic Records
http://www.oclc.org/research/projects/frbr/

最新的FRBR研讨会
FRBR in 21st Century Catalogues: An Invitational Workshop (May 2-4, 2005)
http://www.oclc.org/research/events/frbr-workshop/

用得最多的39个CNMARC字段

    忙中偷闲，抽取本馆2004年的部分CNMARC数据，作了一个类似的字段使用频率统计。总共18418条记录，除本地使用字段外，共使用了90个字段。其中有11个字段只出现了一次，除非书资料外，相信有几个只出现一次的字段为著录错误所致。
    字段计数总共为355680，平均每条记录使用19.3个字段。平均每记录使用字段比前述USMARC统计的18个字段为多也是理所当然的，因为USMARC一个必备的008字段，在CNMARC就至少要用上必备100、101、102，对于数据量最大的专著，还要加上105、106。如此说来，似乎CNMARC记录的总体信息量要少于USMARC记录？可能相对来说，由于后组的原因，CNMARC主题字段数量略少。
    在本次统计中，出现频率超过百分之一的字段为39个，出现频率超过千分之一的有56个字段，出现频率超过万分之一（1次以上）的有79个字段。由于无法统计每条记录的情况，所以可重复字段的出现次数会超过100%。也就是说，即使是统计值为100%的字段，也不一定出现在每条记录中，因为可能有些记录出现多次该字段。以下是39个字段及其统计数据（某些字段应当为100%，如001、100、101、102、200、215，原记录有错误）：

701 121.65%
606 118.82%
801 113.93%
690 113.36%
010 105.77%
001 100.01%
210 100.00%
101 99.99%
200 99.99%
102 99.99%
215 99.99%
100 99.98%
106 99.93%
105 99.02%
005 89.14%
410 59.96%
225 54.59%
320 50.96%
702 30.84%
330 27.49%
517 26.81%
510 25.74%
314 12.33%
300 11.70%
312   8.85%
711   7.76%
600   7.18%
306   7.03%
205   5.79%
333   4.75%
305   3.53%
092   2.28%
304   1.87%
712   1.86%
601   1.84%
327   1.79%
605   1.58%
311   1.48%
607   1.05%

由于专著记录占了数据的绝大部分，所以对于专著以外文献类型记录所用字段，这个统计数据显然是没有帮助的。如连续出版物的110、207、326、310、011字段均未入围，单独统计时，前三个字段的出现率为100%，后二个字段分别是8%和4%。
这个统计的样本不够大，与前述USMARC统计的400多万没有可比性。但由于采用的是较新的记录，或许更能反映目前CNMARC的使用情况。不过，CNMARC目前应用上有一些分歧，采用不同标准的图书馆，统计结果也会有一定的影响，比如本馆不采用411、461、462字段之类，导致410字段出现频率较高。

克特著者号码表知多少？

见到一个克特著者表网站Cutter Author Tables（http://www.cuttertables.com/），原来目前通用的克特表，除了曾介绍过的LC克特表外，还有如下三种：

1、Cutter&aposs Two-Figure Author Table
2、Cutter&aposs Three-Figure Author Table
3、Cutter-Sanborn Three-Figure Author Table

国内常用的，就是第三个版本――克特-桑伯恩三位著者号码表。
这个网站是美国的商业网站，让你去买它的克特表，价格分别是15+、25+和26+8美元（运费+手续费），不知道运至海外是否也这个价。

终于在网上找到了国内常用克特表的全文，是韩国图书馆员协会网站上提供的：“克特-桑伯恩三位著者号码表”Cutter-Sanborn：http://librarian.or.kr/reference/mark/cutter1.htm。前几天已经加在侧栏的链接中了。
原来侧栏链接的是厦门大学图书馆编目部网站上的克特表查询系统，试查了几个，结果不大看得懂。

又：韩国图书馆员协会（Korea Librarian Association）网站（http://librarian.or.kr/）似乎内容颇丰，特设Reference一个大类，上述克特表即在其中。只是对朝鲜文一窍不通，无法逐一探寻。

更新（2005年5月8日）：
    由gt800800评论知道还有OCLC Four-Figure Cutter Tables。
    查一下，OCLC四位克特表包括Cutter Four-Figure Table and Cutter-Sanborn Four-Figure Table。OCLC还有一款自动给此克特号的软件Dewey Cutter Program可以下载，适用于Windows Millennium, 2000, and XP，可惜我的机器太破没法安装试用。
   进而发现还有1-2位字母+3位数字的克特号，不知正式名称为何。