书目记录深度揭示实例·得奖信息

    书目记录要详细到什么程度?现在有水准的编目员的兴趣大概已经不在对著录文献实体本身的描述上了,更希望提供与作品本身有关的其他信息。比如?
    手头有一个例子,CatalogABlog描述了作者在书目记录中用586字段著录作品得奖信息。为获取作品得奖信息,作者还找到了一个”获奖儿童文学作品数据库”Database of Award-Winning Children&aposs Literature (DAWCL)。
    不知道还有没有其他方面作品的获奖数据库?或书评库?

Update(2005/4/20): 感谢豆儿网友指出原文误将586写作856。

CatalogABlog主人David Bigwood 原文如下:I try to include awards information (Field 586) in the bibliographic records. A good place to track down awards is the Database of Award-Winning Children&aposs Literature (DAWCL).

 

计算机识别代替编目员著录?

    最近印度的Durga Sankar Rath和A.R.D. Prasad研究如何用计算机识别印刷图书书目信息。
    其一,根据图书的题名页确认图书的书目信息。做法是:首先扫描题名页,然后由字符识别扫描页并产生保留原字体大小信息的HTML文件,再用计算机程序进行识别信息。
    主要工作是通过统计分析500种题名页上题名、作者、出版者、出版地、版本、卷册、丛编、出版年等出现的位置、字体、标点符号、连接词等信息,建立识别程序。
    比如题名识别的推导方式是:
        出现在题名页的上部或上中部
        出现在题名页之首(75.15%,少数情况是作者或丛编)
        题名字体比其他都大(94.99%)
        如果题名和副题名出现在同一行上,则由冒号或短横分隔
        题名可能含有数字和标点符号
        题名通常含有”The”, “An”,”Introduction”, “Theory”, “in”, “to”
    作者用识别程序试验了50个题名页,有46个得到了正确的结果。

    其二,二位作者以同样做法研究了从题名页背页获取书目信息的方法。如对出版年的判断方法是:
1、如果发现4位数字,且以19或20起始,则该信息可能是出版年;
2、如果以上述方法获得1个以上年份,其中最高顺序值可能是出版年。
    其它主要工作是分析在版编目信息。AACR2的主要款目规定给他们识别题名、责任者添了很大麻烦。

    该文所述对各书目信息判断的文字描述,可用于新编目员培训。当然,其判断方法仍然比较简单,值得改进之处不少。如出版年,所获得的最高值很可能是印刷年。

原文见:
Heuristics for identification of bibliographic elements from title pages. Library Hi Tech, Vol. 22 No. 4 (文摘)
Heuristics for identification of bibliographic elements from verso of title pages. Library Hi Tech, Vol. 22 No. 4 (文摘)

参见:1987年Ling Hwey Jeng的博士论文(The University of Texas at Austin)
“题名页作为书目描述信息源”Thetitle page as the source of information for bibliographic description:An analysis of its visual and linguistic characteristics

 

古腾堡计划提供收录文献的MARC记录

    在LISNew.com上看到Project Gutenberg Catalog available — as MARC / Rochelle on Sunday January 02,全文如下:

pamplemousse writes “I haven’t seen this announced anywhere, except on the PG lists, but Project Gutenberg now makes available a complete catalog of their archive, in machine-readable formats. Publicly, they have an RDF/XML version available — links at http://www.gutenberg.org/feeds/ — but there is also a MARC21 format available as .zip file or bz2 file
(Disclaimer: I know this because I wrote the conversion from RDF to MARC.) The intention is to provide a MARC file which libraries may use to add records to theie catalogs for PG titles. What’s needed now is for experienced and knowledgable cataloguers to cast an eye over the result, and provide feedback.”

   这可是件很有意义的事,便于图书馆将古腾堡计划中的共享资源放入图书馆目录。于是下载了MARC文件。看后,确实如文中所说,”What’s needed now is for experienced and knowledgable cataloguers to cast an eye over the result, and provide feedback.”实在是有点简陋得惨不忍睹,也不能说是基于DC的缘故吧?在古腾堡计划的下载页面上也没见到让提供反馈信息的地方。

附MARC记录实例:

 

cam a
00014211
003PGUSA
00520041209150954.0
008ctermss040  |aPGUSA|b
042  |adc
24510|aWanted–A Match Maker |h[electronic resource]
260  |bProject Gutenberg,|c
500  |aProject Gutenberg
506  |aFreely available.
516  |aElectronic text
830 0|aProject Gutenberg|v14211
85640|uhttp://www.gutenberg.org/etext/14211
85642|uhttp://www.gutenberg.org/license|3Rights