OCLC的LC名称规范服务及其它

    OCLC研究部在参与eprints UK项目时,开发了“LC名称规范服务”(LC Name Authority Service)。这是一个建机构库中使用LC名称规范档确认名称的Web服务。最近Ralph LeVan改进了名称查找的匹配算法,可以处理拼写错误及名称变异形式,检索结果智能排序基于WorldCat中名称的使用次数,以及规范档中的规范形式而非参照款目。

    试试它的交互检索联机演示:http://alcme.oclc.org/eprintsUK/index.html
    在搜索词框中输入检索词“Mark Twain”(没有按常规则的倒序输入),不管设定最大结果数为多少(如5或10),结果都是把所有相关的二十多条规范记录都列了出来。最相关的列在最前。大名鼎鼎的马克?吐温,竟然也会有二条规范记录?原来一个是真人,一个是某部作品中与作者交谈的马克?吐温的灵魂(Spirit)――应该是名称主题了。
    OCLC给每条规范记录一个固定URL,还有相应的XML记录,形式如:
http://errol.oclc.org/laf/n79-21164.html (MARC规范记录)
http://errol.oclc.org/laf/n79-21164.marcxml (MARCXML规范记录)
(其中n79-21164为LC的规范记录号)

    OCLC开发这个服务的目的,是为了使机构库软件(如DSpace, ePrints UK, CONTENTdm, eprints.org, Fedora)可以提供规范控制,而不必自建规范控制模块。使用OCLC研究部的名称规范服务,可以在输入元数据时确保作者名称的一致性。DSpace计划在未来集成交互式的规范检查。

    不过,机构库用LC名称规范?恐怕大部分人在LC规范库中都是找不到的,毕竟出版图书的人与发表文章的人相比,数量要少得多。Lorcan在谈到上述名称规范服务时,提到他早些时候的想法,利用“科学社区”(Community of science, COS) 的50万研究人员信息做实验,看是不是可以用其数据扩充LC规范档。
    看COS的研究人员存档信息示例,内容丰富详尽,包括所属机构、联系信息、学历、专长与研究兴趣、研究项目、产业相关性、关键词、使用语言、学会/协会成员、获奖信息、专利、获得资助项目、发表/出版一览等。像猎头公司的数据库,与LC规范记录以名称的各种变体为主的结构完全不同。COS还是一个Web 2.0的网站,研究者可以自己提供与维护相关信息。
    另外,Scopus宣布5月13日起提供名称规范功能“Scopus Author Identifier”,可惜有关演示仅限其客户。Scopus是最大的研究文献与精选网页的文摘引文数据库,收录2700万文摘、2.3亿引文、2亿网页。不知其中有多少不同的人名。

    看来,名称规范也已不是图书馆界的独家秘技了。Leon问地狱是不是需要元数据(天堂需要元数据吗?),岂止需要,早就有了。阎王的生死薄就是一个古往今来中国人的名称规范档,尽管偶而有点问题,小鬼据此抓错了人(不排除小鬼没有认真查核规范而出的错),但其完整性是不容置疑的。我们现在有质量这么高的规范档吗?国家图书馆?CSSCI?期刊网?

相关链接:
Lorcan Dempsey&aposs weblog:
A note on names (2006-5-16) http://orweblog.oclc.org/archives/001022.html
Research support: COS and CSA (2006-2-13)
http://orweblog.oclc.org/archives/000946.html 

Outgoing: Name searching (2006-5-17)
http://outgoing.typepad.com/outgoing/2006/05/name_searching.html