CALIS联合目录与国家图书馆的不一致问题――LCSH更新的启示

    前几天,在杭州参加CALIS联合目录用户委员会第三次会议,质量控制组成员有一个议题是讨论“中文团体名称规范”。因为CALIS联合目录规范库前期建设已进入最后阶段,完成中文团体部分,就可以正式投入使用了。
    由于CALIS联合目录制定的著录规则与国家图书馆在诸多方面不一致,导致大陆及港台多方质疑。为能与国图保持一致,CALIS积极参与第二版《中国文献编目规则》的编制。不过,据说有些原来争论确定的内容,最终出版已非原来面目,让参与编写的CALIS一方很是郁闷。
    更令人郁闷的是,国图的做法也不完全依据《规则》。在这种情况下,《规则》是否还具有其权威?为名称规范,CALIS已经投入很大人力,期间团体名称形式还做过多次更改。在目前状况下,是否要完全按《规则》做,就存在了很大的疑问。讨论的结果是保持现状。
    对于团体名称规范方面,据说国图不完全依据《规则》的原因是,书目库中现有的数百万条记录无法更改。听到这种说法,当时我的想法是,只要确定规范形式,完成规范记录,书目记录按规范作全域更新即可,不存在无法更改的问题。

    今天看到博客“图书馆果汁”(Library Juice)上一篇“芭芭拉访谈”(Interview with Barbara Tillett),才感到,具体操作时需要考虑的问题,实际上远没有外人想象的那么容易。同时,只要本着积极的态度,总是可以期望找到解决问题之途的。
    芭芭拉是美国国会图书馆编目政策与支持办公室(CPSO)主任(她是编目领域的名人,还有一大堆其他头衔),此番就美国国会图书馆标题表(LCSH)接受博主Rory Litwin访问。起因是Sanford Berman撰写专著批评LCSH改革不够,用词欧洲中心、男性至上、污辱与晦涩等等。芭芭拉的回应,既说明LCSH不断进取的现状,又表明积极改进的态度。可以说通过博客这个平台,为LCSH好好地做了一回宣传。

    通读全文,有以下心得:

1、技术变化才使很多事情成为可能。LCSH已有百多年历史,尽管一直在更动,但直到1981年卡片目录关闭后才能做更多改变。比如第一次世界大战,在1981年前一直是“欧战”(European War, 1914-1918),之后才改成“世界大战”(World War, 1914-1918)。毕竟逐个改卡片不是好玩儿的。

2、现有技术不一定能解决所有问题。在LCSH中,基督教的神“上帝”直接用 God,而其它教的神就要另加限定词,如“安拉”用 God, Muslim。对于一个多民族的国家,这样做显失公平。但由于 God 在LCSH还指泛称的“神”,这就导致不能直接将 God 通过全域更新改成如 God (Christianity) 这样的形式。

3、需要不断探索解决问题的方法。仍是对 God,现在已经找到了解决方法,就是配合使用分类号,确定其含义是泛称的“神”还是基督教的“上帝”。

    就是老毛的话:“世上无难事,只要登攀。”

 

OCLC的LC名称规范服务及其它

    OCLC研究部在参与eprints UK项目时,开发了“LC名称规范服务”(LC Name Authority Service)。这是一个建机构库中使用LC名称规范档确认名称的Web服务。最近Ralph LeVan改进了名称查找的匹配算法,可以处理拼写错误及名称变异形式,检索结果智能排序基于WorldCat中名称的使用次数,以及规范档中的规范形式而非参照款目。

    试试它的交互检索联机演示:http://alcme.oclc.org/eprintsUK/index.html
    在搜索词框中输入检索词“Mark Twain”(没有按常规则的倒序输入),不管设定最大结果数为多少(如5或10),结果都是把所有相关的二十多条规范记录都列了出来。最相关的列在最前。大名鼎鼎的马克?吐温,竟然也会有二条规范记录?原来一个是真人,一个是某部作品中与作者交谈的马克?吐温的灵魂(Spirit)――应该是名称主题了。
    OCLC给每条规范记录一个固定URL,还有相应的XML记录,形式如:
http://errol.oclc.org/laf/n79-21164.html (MARC规范记录)
http://errol.oclc.org/laf/n79-21164.marcxml (MARCXML规范记录)
(其中n79-21164为LC的规范记录号)

    OCLC开发这个服务的目的,是为了使机构库软件(如DSpace, ePrints UK, CONTENTdm, eprints.org, Fedora)可以提供规范控制,而不必自建规范控制模块。使用OCLC研究部的名称规范服务,可以在输入元数据时确保作者名称的一致性。DSpace计划在未来集成交互式的规范检查。

    不过,机构库用LC名称规范?恐怕大部分人在LC规范库中都是找不到的,毕竟出版图书的人与发表文章的人相比,数量要少得多。Lorcan在谈到上述名称规范服务时,提到他早些时候的想法,利用“科学社区”(Community of science, COS) 的50万研究人员信息做实验,看是不是可以用其数据扩充LC规范档。
    看COS的研究人员存档信息示例,内容丰富详尽,包括所属机构、联系信息、学历、专长与研究兴趣、研究项目、产业相关性、关键词、使用语言、学会/协会成员、获奖信息、专利、获得资助项目、发表/出版一览等。像猎头公司的数据库,与LC规范记录以名称的各种变体为主的结构完全不同。COS还是一个Web 2.0的网站,研究者可以自己提供与维护相关信息。
    另外,Scopus宣布5月13日起提供名称规范功能“Scopus Author Identifier”,可惜有关演示仅限其客户。Scopus是最大的研究文献与精选网页的文摘引文数据库,收录2700万文摘、2.3亿引文、2亿网页。不知其中有多少不同的人名。

    看来,名称规范也已不是图书馆界的独家秘技了。Leon问地狱是不是需要元数据(天堂需要元数据吗?),岂止需要,早就有了。阎王的生死薄就是一个古往今来中国人的名称规范档,尽管偶而有点问题,小鬼据此抓错了人(不排除小鬼没有认真查核规范而出的错),但其完整性是不容置疑的。我们现在有质量这么高的规范档吗?国家图书馆?CSSCI?期刊网?

相关链接:
Lorcan Dempsey&aposs weblog:
A note on names (2006-5-16) http://orweblog.oclc.org/archives/001022.html
Research support: COS and CSA (2006-2-13)
http://orweblog.oclc.org/archives/000946.html 

Outgoing: Name searching (2006-5-17)
http://outgoing.typepad.com/outgoing/2006/05/name_searching.html

 

[代发] 西文编目网络在线资源 / 新陆

    近年来,随着计算机技术和网络技术的广泛应用,编目工作在组织与揭示文献资源方面有了更加广阔的发展空间。编目的任务是对文献资源进行整序,向读者揭示文献的信息,提供检索途径,其中,网络查找能力对于西文编目工作至关重要,它直接关系到编目数据的质量和生命。本人根据多年从事西文编目工作的经验,对部分实用网络在线资源进行小结,以期与同行交流,共同提高。

一.外来数据源

1. 国会图书馆书目数据库(http://catalog.loc.gov/)
    该数据库权威且数据量大,目前记录总量达1700多万。但套录时注意区分它不同的编目等级和鉴定机构,保证质量。

2. OhioLink(http://198.30.120.21/)
    数据量,实效性优于国会,但有自己的执行标准,应注意。

3. 各国国家图书馆
国图数据库(http://www.nlc.gov.cn/res/index.htm)
    国图网址新改版界面,丰富了内容,查找更方便。此处有139个国家图书馆的介绍和网址,大家可前去查询。也可从顾犇,吴建中博士的个人主页上作链接,或利用 Google 查找。

4. 欧洲及英国
欧洲公共图书馆(http://www.pulmanweb.org/)
    2005年3月新开,可链接欧洲各国图书馆,并有简介等。
英国Copac(http://copac.ac.uk/wzgw?f=f&form=A%2FT&id=987173)
    是英国非常全的数据库。包括英国和爱尔兰24个主要大学的联合目录。但没有MARC显示。
牛津大学OPAC(http://library.ox.ac.uk/)
    图书馆历史悠久,藏书丰富,可查到许多近代的图书。
伦敦大学东方及非洲学院The School of Oriental and African Studies (SOAS)(http://lib.soas.ac.uk/)
    中国学方面的图书收藏很丰富,其中许多是近代的图书。是东亚图书馆成员之一。

5. 加拿大
加拿大多伦多大学(http://www.library.utoronto.ca/)
    加拿大多伦多大学有300类本科专业,32座图书馆组成,其自动化系统是世界上较有影响的联机编目网络。数据全,时效快。

6. 港澳台地区
香港高校图书联网(http://hkall.hku.hk/)
    同时提供香港八所主要高校书目资源检索,有MARC格式显示,可免费下载。共同构成当前较全的文献收藏体系,其中中文文献的罗马化著录值得借鉴。
澳门大学图书馆(http://umaclib3.umac.mo/)
台湾地区联合目录(http://nbinet1.ncl.edu.tw/screens/opac_menu.html)

7. 日本早稻田大学图书馆(http://www.wul.waseda.ac.jp/index.html)
    可显示MARC格式。

8. 其他
东亚图书馆 East Asian Library(http://www.lib.ku.edu/eastasia/linkeal.shtml)
    主要包括中国研究,日本研究,韩国,朝鲜研究,列出机构,计划,图书馆OPAC,所用系统,共由50多个国家和地区的机构构成。
夏威夷大学的中国研究中心(http://www.chinesestudies.hawaii.edu/links/general.html)
    有中国数据中心数据库,中国研究数据库,中国传记人物数据库等多个数据库介绍。图书馆的中文文献收集十分丰富,可直接中文检索,数据以880字段形式著录,可显示MARC格式。
德国卡尔斯鲁厄大学的搜索网页(http://www.ubka.uni-karlsruhe.de/hylib/en/kvk.html)
    可同时提供十八个国家三十八个编目机构、六家书店的网上数据查询,是西文小语种编目的首选网点。
以OCLC WorldCat数据库为基础的检索,在Google检索框中键入“find in a library”及检索内容即可。(http://www.oclc.org/worldcatdownloads/)

学位论文
网络博硕士学位论文数字图书馆(NDLTD)(http://www.theses.org/)
    美国图书馆协会ALA评选的最佳网站,部分论文可免费阅读,但时效性较差。
    国图电子文献可提供美国,加拿大,欧洲博硕士论文(PQDD)数据库, 可提供题名,著者,文摘等信息,并显示文献前20页左右内容。但数据主题词太宽泛,专指性差。最好是通过Google去各大学图书馆查看数据。
博士论文全文中国集团(PQDD)镜像点网址(http://202.120.13.45/umi/index.jsp)

9.Z39.50网关地址:
LC的链接(http://www.loc.gov/z3950/)
    有些由于系统不同无法显示。
LibDex全球图书馆名录(http://www.libdex.com/)
    包括18000多个图书馆,按国家,地区列类;包括OPAC情况;书商的链接;博客链接等等。
Index Data公司的“Z39.50服务器名录”(http://www.indexdata.dk/targettest/)
    内容很详细。有各馆应用情况列表及各种统计。Z39.50的情况。

二.编目规则与标准
1.AACR2(http://www.aacr2.org/)
    英美编目条例正准备出版新一版的规则RDA (Resource Description and Access)。
RDA (Resource Description and Access)(http://www.collectionscanada.ca/jsc/rda.html)
2.MARC21 Concise Format for Bibliographic Data(http://www.loc.gov/marc/bibliographic/ecbdintr.html)
    权威网址,上面有各字段具体的说明,举例。十分详细。MARC21是一个动态规则,随时都在发生着变化,我们要随时关注MARC的变化,保持我们编目工作的高水平。
3.OCLC Bibliographic Formats and Standards(http://www.oclc.org/asiapacific/zhcn/bibformats/default.htm)
4.MARC Code List for Countries (Web Version of the 2003 Edition)
    国家代码(http://www.loc.gov/marc/countries/)
5.MARC Code List for Geographic Areas (Web Version of the 2003 Edition) 地理区域代码
    从地名查代码:http://www.loc.gov/marc/geoareas/gacsatod.html
    从代码查地名:http://www.loc.gov/marc/geoareas/gacscode.html#part2
6.MARC Code List for Languages (Web Version of the 2003 Edition)
    语言代码(http://www.loc.gov/marc/languages/lang_a2b.html)
7.MARC Code List for Organizations (Web Version of the 2003 Edition)
    机构代码(http://www.loc.gov/marc/organizations/orgshome.html)
8.国会图书馆分类编目服务主页(http://www.loc.gov/cds/)
9.国会图书馆连续出版物主页(http://www.loc.gov/acq/conser/)
    CONSER Cataloging Manual连续出版物编目指南(http://www.itsmarc.com/crs/manl1573.htm)
10.关于元数据的十万个为什么 上海图书馆刘炜编(http://www.libnet.sh.cn/sztsg/fulltext/abc/metaFAQ.pdf)

三.文献分类标引工具
1.美国国会图书馆分类法(http://www.loc.gov/catdir/cpso/lcco/lcco.html)
2.杜威十进分类法(http://www.oclc.org/dewey/)
3.国际十进分类法(http://www.udcc.org/)
4.布利斯书目分类法(http://www.sid.cam.ac.uk/bca/bcahome.htm)
5.ACM计算机分类法(http://www.acm.org/class/1998/)
    The ACM Computing Classification System,由Association for Computing Machinery编制。
6.数学主题分类法(http://www.ams.org/msc/)
    Mathematics subject classification 2000版,由American Mathematical Society 编制。
7.物理和天文学分类法(http://publish.aps.org/PACS/)
    Physics and Astronomy Classification Scheme PACS,由American Institute of Physics编制。
8.光学分类表(http://www.osa.org/pubs/ocis/)
  &n
bsp; Optical Classification and Indexing Scheme,由Optical Society of America (OSA)修订。
    以上专业分类法在西文科技书或会议录的在版编目中常有出现,供大家分类时参考。
9.国会图书馆分类编目服务主页The Library of Congress Cataloging Distribution Service : Bibliographic Products & Services(http://www.loc.gov/cds/)
    包含大量编目工具,多为收费服务。其中的Classification Web颇具特色,提供LCC、LCSH、DDC之间的一体化查询,网址为http://classificationweb.net/Menu/index.html
10.其他分类法
社会历史和行业分类 (Social History and Industrial Classification SHIC)
    是英国博物馆主题分类法。
是美国斯坦福大学的文献保护主题分类表Preservation Descriptors & Classification Schemes(http://palimpsest.stanford.edu/lex/kessecls/)

四.书目数据规范及主题
国会主题网址(http://www.loc.gov/cds/lcsh.html#free)
密苏里州立大学主题标目查询(http://fantasia.cs.msstate.edu/lcshdb/index.cgi)
    主题标引在西文编目中是揭示文献内容的主要渠道,主题词的准确,规范,适度,决 书能否被合理利用。
美国医学主题词表 Medical Subject Headings (Mesh)(http://www.nlm.nih.gov/mesh/meshhome.html)
国会规范网址(http://authorities.loc.gov/)
规范查询网址(http://authorities.loc.gov/cgi-bin/Pwebrecon.cgi?DB=local&PAGE=First)
    在现代图书馆中,规范的作用越来越重要,它直接影响工作的质量,读者检索的准确度。 一条数据中涉及规范的字段超过一半(责任者,题名,丛书,主题),数据随时变化,我们应随时跟进查询,维护。

五. 编目员参考资料
1. 编目工具
克特著者表 Cutter Author Tables(http://www.cuttertables.com/)
    克特著者号码表有多种版本,“编目精灵”上有具体的介绍。编目工具箱“Toolbox”, 编目参考架CRS上都有与LC的链接。
拼音转换表
    韦氏与汉语拼音对照表(http://www.loc.gov/catdir/pinyin/romcover.html)
    此表在《不列颠百科全书》的附录中有纸本.
地名查询
   The GEOnet Names Server(http://gnswww.nga.mil/geonames/GNS/index.jsp)
   中国行政区划网(http://www.xzqh.org/suoyin/index.htm):包括中国,外国政区,其中历史沿革可揭示古代至今的地名变化。网站维护更新及时,信息质量较高。
传记资源查询 Biography Resource Center(http://www. galenet.com/servlet/BioRC)

2. 网络指引
加拿大纽芬兰纪念大学图书馆的编目工具箱(http://staff.library.mun.ca/staff/toolbox/)
    包括13个方面,书目方面,MARC规则方面,包括各种文献类型的著录规则,国会的规定,其他馆的链接,OPAC的查找方法。很有参考价值。
编目员的参考架 Cataloger’s reference shelf(http://www.itsmarc.com/crs/CRS0000.htm)
    界面直观,查找方便。内容涉及多种文献类型,编目的各方面内容MARC格式,规范,标目及规则。
图书馆员的网络图书馆 Internet library for Librarians(http://www.itcompany.com/inforetriever/)
    侧重网络服务。介绍各种数据库,网络查询传输等的情况。
图书馆员网络索引(http://lii.org/)
    是世界著名的网络信息导航库。内容庞大、类目划分上千种,包括1万多种网络资源,链接了3万多个网站。其中“Ready Reference & Quick Facts”中的“Dictionaries, Encyclopedias”集中了许多实用的网站,请大家自己查看,以下不再一一列举。

3. 语言文字类
十二种欧洲语言文字识别检表(http://bgu61.nease.net/download/acan.htm)
    可据此迅速判断西文小语种的文种,并与《西文文献著录条例》后附录中的“24种外国语言的识别”相配合准确确定文种。
词霸搜索(http://cb.kingsoft.com/?s=usury)
    金山词霸, 可同时显示多种专业字典检索结果。
Google的语言工具(http://www.google.com/language_tools?hl=zh-CN)
    可翻译一段文章,提供英语与中、法、德、意、日、西、朝鲜语的互译。
猜猜家(http://www.xrce.xerox.com/competencies/content-analysis/tools/guesser-ISO-8859-1.en.html)

4. 百科全书及字典
国外的各种百科全书及字典请从上面“图书馆员网络索引”中查找,链接。