Scopus的作者规范与分面检索

    去年五月,看到“Scopus Author Identifier”的报道,觉得是一种作者的规范。访问Scopus网站,可惜相关资料只限订户观看。不几日发现本馆正在试用Scopus,正好登录进去一看究竟。

    数据库试用时对Scopus的介绍:
    SCOPUS 是 Elsevier 公司的文摘索引数据库,它收录了 13450 种经同行评议的出版物 (主要为期刊) ,学科覆盖数学、物理学、化学、生物学、生命科学、农业、地球和环境科学、工程、心理学、社会科学等领域。
    SCOPUS 数据库还有以下几个主要特点:
1 . 可以检索论文被其它文献引用的情况;
2 . 可以检索到上至 19 世纪发表的文章;
3 . 可以检索到互联网上的相关文献。
用户可通过 Scopus 网页右上方红色的“ Register ”进行个人注册,从而利用 Scopus 中的 Alert 推送服务。

    今天想起此事,把当时的截屏在此存个档:
1、在基本检索与高级检索之外,单独设作者检索,比较特别。并且作者检索也可以设置推送,可用于跟踪特定作者的检索。

Scopus Author search

2、作者检出结果注明作者的主题领域以及所在单位,便于区分同名者。除列出命中文献数量外,还有作者详细信息链接。

Scopus Author result

3、作者详细信息页面左栏有两部分,Personal 列出作者名称的其他形式等关于其本身的信息,相当于名称规范档;Research 部分有其收录文献数、被引数及合作者数及其链接。右栏是 Documents 的详细列表,可直接链接到文摘信息 Abstract+Refs。

Scopus Author details

    看 Scopus 网站上的最新演示,检索界面不见了 Author Search,不知道是不是演示版的简化。另有新发现,也可能是以前没有注意到:

Scopus Refine results
1、有 Full Text 链接。演示没有说明这个文摘索引库中的全文由何而来。
2、检索结果页面上方的 Refine Results,提示与本次检索有关的内容,供进一步限定 limit to 或排除 exclude。共有五个面:出处/题名、作者、发表年、文献类型和主题领域。分面检索潮流中的又一个例子。

搜索我们的历史:为什么百度不做?

    百度要去日本搜索引擎市场占一席之地,据说是因为中国的搜索广告市场太小。市场我不懂,但我知道百度在中国还有很多可搜索的内容没有做。

    Google在新闻搜索的基础上,推出了新闻档案搜索(Google News Archive Search),把《华盛顿邮报》《国际先驱论坛报》《纽约时报》《福布斯》《时代》等报刊一二百年的全文扫描后上网,让大家按时间搜索查看,为什么百度不可以也摩仿一把呢?

    Google推出图书搜索,与出版社合作时很顺利,但与图书馆合作,就惹上了版权官司。百度很谨慎,只做没有版权问题的“国学”,内容少得可怜;只与图书馆合作搜索书目信息(与北大与中科院),建最大的中文图书检索库。不知道这个最大的中文书目库是不是已经投入使用,我从来没有在百度的搜索结果中见到过(当然百度我也用得不多)。
   
    目前虽然很多图书馆都在做古籍与民国文献的全文扫描,但真正做OCR的很少。“百度国学”中的很多内容,其实已经在网上其它地方可以找到,而那些同样没有版权问题的古老报刊,却是真的很难获取。如果百度做了,善莫大焉。
    八十年代,上海书店影印出版从1872到1949年的全套《申报》。为方便利用,其后本馆有不少人参与《申报索引》的制作。一切都是手工的,其中艰辛可想而知。索引陆续出版了若干年,终于没法继续、半途而废了。像《申报》这样的报纸各地应该也有不少,对研究中国近现代社会的变迁很有价值。如果百度接手做这件事,岂不美事一桩?[update 2006/12/15: 1919-1949的《申报》索引已编制完成,出版正计划中]

    百度为什么不做呢?繁体字OCR的可用性问题要解决,以现在的技术,应该不是件太困难的事。[update 2006/12/16: CADAL正在做繁体字文献的OCR]
    不会是没有图书馆愿意合作吧?如果百度有像Google那样与图书馆合作的意向,我首先自荐本馆。

可定制RSS的图林博客搜索引擎LibWorm

    医学图书馆员David Rothman,用医学博客搜索MedWorm.com觉得不错,便向在英国的设计者Frankie Dolan女士建议把同样的方法用于图书馆博客界(biblioblogosphere)。Frankie认为没问题,前提是由David承担日常管理工作。于是David收集RSS Feeds、安排分类、提出一些预制搜索、建议功能与界面,经过三个月的努力,由Frankie完成所有设计,LibWorm公开运行。

    LibWorm目前已有约1400个RSS Feeds。
    最初David咨询了Steven Cohen和Blake Carver,得到了第一批Feeds。那二位是LISFeeds的创建者,LISFeeds现已不复存在,而两年前我们也是从那里开始看国外图林博客的。
    接着David从Amanda Etches-Johnson’s Blogging Libraries Wiki得到了数百个图书馆的博客,并且借鉴了Amanda的分类。
    现在,通过免费注册,用户可以自己把Feeds增加进去。
    当11月25日,当David在自己博客中公开LibWorm时,Feeds数是超过1100,短短数日,就增加了数百。从搜索结果看,就图书馆界而言,比Google博客搜索收录的要广得多。

    在1100多个Feeds时,博客800多,还有图情期刊目次及图书馆人士感兴趣的其他信息源。
    LibWorm作为专业的RSS搜索引擎,特别值得推荐的是它有多种RSS订阅,满足不同角度的需求:

        每一个搜索结果都可以生成一个RSS Feed,可用于跟踪某一感兴趣专题(这个Google的博客搜索也有,后面两个Google就没有了)。如果订的博客有限,如此可扩大信息来源;如果订的博客太多,时常来不及看,则可选择只看几个博客、某些专题。
        分类(http://www.libworm.com/rss/librariancategories.php):把博客分成三十个左右的类,如播客、书评、图情杂志、幽默、公共图书馆、法律图书馆、医学图书馆等
        主题(http://www.libworm.com/rss/librarianqueries.php):David根据图情的领域与一些热点,预制的一些博客内容搜索,如会议、版权、电子书、Library  2.0、Mashups等,据说不是简单的一个关键词。

    注册登录后除了可以增加RSS Feed外,还可以使用LibWorm内置的聚合器。David说注册目的是为了未来设想中的社会性功能。(记得谁说过,Web 2.0的特征之一就是要注册!?)
    试了一下,目前还没有包括中文。

对LibWorm的介绍,参见:
About LibWorm:上面的故事大多来自这里
LibWorm: Search and Current Awareness for Libraryfold:David宣布LibWorm开张Information Wants To Be Free:LibWorm: Searching, syndicating and aggregating the bibliblogosphere:维基女王Meredith的报道最详尽
Tame The Web: Libraries and Technology: Announcing LibWorm: Search the Biblioblogosphere
Stephen’s Lighthouse: LibWorm

另:最近由于有人提议维基百科删除”Library 2.0″词条,又引起”Library 2.0″概念之争。David针对T. Scott的反对意见,写了一大篇评论,颇受关注。Tame The Web、LibraryCrunch写博文点评,The Shifted Librarian在David博文下长篇留言。