美国国会图书馆的一站式“新搜索”

    美国国会图书馆(LC)网站新开通了beta版的“New Search”,一站检索LC网站上提供的信息。目前集成了四个部分,今后还将视大家的反应考虑增加范围:

美国历史文化(American Memory):1050万数字资源
LC联机目录(Library of Congress Online Catalog):1400万书目记录
印刷图片与照片目录(Prints & Photograph Online Catalog):100多万图像 [我的介绍:不仅仅是第100万张数字化图片上网]
LC网站(http://www.loc.gov)

    FAQ(http://www.loc.gov/search/new/help/faq.html)说明,虽然美国记忆、联机目录、图片与照片目录均是LC网站中的内容,但那都是保存在数据库中的。LC网站检索针对的是网站中的静态网页,内容也很丰富,看看它的首页就知道了。

    LC网站上的还有不少数据库(http://www.loc.gov/library/libarch-digital.html)。记得keven曾经介绍过几个,自己也曾介绍过全球网关(Global Gateway: World Culture & Resources)。集成检索对用户无疑方便不少。不过,单就搜索界面而言,Google式的检索框,似乎简单得过了头——Google还有高级检索呢,LC新搜索没有。

    共享书目网站LibraryThing的创始人Tim介绍LC的新搜索,首先是简单的称赞,然后讲一大堆不足。虽然不足的话超过称赞的话,但Tim还是认为LC的行动值得称赞:

优点:
    联邦搜索
    Google式的界面,干净简洁吸引人
    使用Ajax

不足:
    只不过一个新面孔,没有重新处理,结果还是链接到各自老家
    结果没有按相关性排序
    用词不简洁(word junk),“注意…”、选择资源“检索”等词在Tim看来在特定的场合都是多余的
    URL太复杂,如选择四个部分检索“cookery”,URL长达143个字符

    不过Tim指出,这回的检索URL是永久的。
    永久URL意味着可以在其它地方引用,而以往至少检索LC联机目录的URL是与session有关的,要失效的。比如LC联机目录中的这本书,用“新搜索”的URL,就不会timed out(用LCCN作为检索式)。

在书目中实践FRBR(外一篇:民国书目检索)

(一)

    参与编制一个外文专题书目,从研究者利用考虑,计划按分类编排。分类之下,我考虑到图书有再版问题,倾向于按书名编排,可以把同一种书集中在一起。但大家都以为分类之后按出版年代排序,可以显示研究的发展脉络。
    年代排序的确是更可取的方法。那么,再版问题如何解决呢?一种办法是只取最早的版本。编制本书目的目的是全面揭示国外这一专题领域的文献,方便研究人员获知、获取文献,所以计划提供一些馆藏地。如果最早版本国内没有收藏,难道就此舍去?还要研究者花钱去国外馆际互借?
    我想到了FRBR,可以把各种版本都排在能够查到的最早版本下,即使名称有所更动也没关系。这样一举多得,既保留研究的发展脉络,又能反映研究的重要程度及影响,还能提供尽可能多的馆藏信息。
    在试查过程中,又发现还可能有不同语种的译本。征求负责人意见,决定先在书目信息中保留原题名。我内心的想法是,在最后处理数据时,彻底贯彻FRBR,将不同语种译本按原著的出版日期集中在一起。反正处理数据是我的事,到时就由我了。

(二)

    在做民国图书的扫描,我以为最重要的是尽可能避免与其他馆做重复的事。一则处理能力有限,二则民国图书大多很脆弱,经不起折腾。
    找到开放检索又能全文浏览的CADAL(http://www.cadal.net)已是幸事,因为它收录了国内重要大学的民国馆藏。由于民国图书编目多为简编,且不大会有中图分类号,这两点就把民国书目排除在现今CALIS联合目录之外了。所以查CADAL有点一站式检索的意思。只不过从各馆提交数据的统计上看,尤其在民国书刊方面,各馆的参与程度相差很大。所以这个“一站式”还是打折扣的。
    我开始只考虑其他馆已经数字化的部分,没有想到正在做的。馆里一位专家告诉我上海图书馆正在做,可以查《民国时期总书目》了解国内民国馆藏大户的收藏情况。于是找来《民国时期总书目》(收录国家图书馆、上海图书馆和重庆图书馆民国图书),查一下经CADAL筛选留下打算扫描的图书。查的结果,自然又筛出去一部分暂时不做扫描。
    有意思的发现是,《民国时期总书目》其实也在某种程度上应用了FRBR:对同一种书只设一个条目,其下列出各种版本,合并说明馆藏;同书的不同的译本,虽然分设条目(往往译名不同),但前后排列,在提要中只说明是“前书的另一译本”云云。
    当然《民国时期总书目》早于FRBR,说“应用”并不恰当。这只能说明FRBR在书目工作中是有深厚基础的。早先想研究简化编目,借过一本苏联人写于五十年代的书,其中就有类似的做法。

(三)

    在查《民国时期总书目》前,在网上查国图与上图,只发现古籍部分——上图有“古籍书目数据库”(http://search.library.sh.cn/guji/),而国图的“古籍善本”(http://www.nlc.gov.cn/service/guancang/gujishanben.htm)只列出了其它馆的古籍检索链接。
    因为没发现民国图书,以为都没有提供书目检索,所以只能很辛苦的查《民国时期总书目》。刚才写着,又上国图(http://210.82.118.4:8080/F/)与上图(http://ipac.library.sh.cn)的书目检索去查了一道,发现其中都包括民国图书。看来可以把《民国时期总书目》还掉了?

在工商局网站查公司信息

    找了为邻居装修的一家小公司来装修房子,有点担心会不会属于马路装修队之流,如果装修质量有问题,找不到方向。
    想想现在政务公开,工商局网站应该查得到是不是真有这家公司。在网站上逛了一圈,发现只有注册才能查,那就注册吧。注册完登录进去,“企业基本信息查询”搜索栏与Google一样简洁,只是底下有一行注释:“在本栏目中,输入企业中文名称全称”。
    要用“全称”检索?关键词不行?前方一致没有?现在还有这种古董级的检索系统?
    用预算表上的“上海XX装饰工程有限公司”查,没查到,再次提示“您所输入的查询条件必须是企业中文名称全称!”再翻预算表,发现里面名称略有不同,是“上海XX室内装潢有限公司”,再查,也没有。真正令人泄气。
    正好手边有一家常在媒体做广告的公司寄来的信,用信封上的公司名称“上海市YY装饰公司”查,也没有。真令我对这个查询系统是否能查到什么内容心生疑惑。在名称上加加减减,最后用“上海YY装饰公司”,总算查到了。
    检索结果显示,这是真正的“基本信息”查询,因为显示的内容只有企业名称、地址、登记(受理)机关和状态四项。除了知道这家很牛的YY公司注册地址在市郊外,法人代表、注册资金、注册时间之类,一概没有。下面一行说明信息:“如需查询公司具体登记事项的,请到该企业的登记(受理)机关申请查询。”看来工商局也在网上钓鱼,让人上门交钱后再向你提供更详细的信息。

    刚又看到电视上报道某健身俱乐部骗走顾客钱财一走了之,记者、官员、专家大概照例又要谆谆教导大家不要轻易上当了。信息获取不易,上当自然不可避免。街上的店,不会用公司全称作招牌,要顾客如何用“全称”查到公司情况;好不容易查到了,也没多少有用信息。不知道他们是不是要顾客在消费前,都跑到市郊的工商分局去走一趟。

    签约装修那天来到公司。墙上挂着不少铜牌、锦旗什么的,看来公司已经在当地开了多年;特别醒目的是市室内装饰行业协会成员的牌子,似乎不是冒牌公司。特地留意看公司名称,各处标示也是五花八门的。拿到合同,才发现公司大名是“上海XX装饰有限公司”。回家上网再查,这回查到了,注册地址也是郊区。因为有前面查YY公司的经验,也不觉得奇怪。后来又查了几家总部设在闹市的著名装潢公司,注册地址在市郊的还不在少数。

    大家都很喜欢把图书馆与Google和亚马逊对照,以此嘲弄图书馆联机目录(OPAC),我也是这样。通过此次查工商局网站,发现相对于由电子政务工程建立起来的工商局网站,基于检索理论建立起来的OPAC,可说是比上不足、比下有余了。