乐此不疲 – 第 37 页 – 编目精灵III

Scopus的作者规范与分面检索

去年五月，看到“Scopus Author Identifier”的报道，觉得是一种作者的规范。访问Scopus网站，可惜相关资料只限订户观看。不几日发现本馆正在试用Scopus，正好登录进去一看究竟。

    数据库试用时对Scopus的介绍：
    SCOPUS 是 Elsevier 公司的文摘索引数据库，它收录了 13450 种经同行评议的出版物 (主要为期刊) ，学科覆盖数学、物理学、化学、生物学、生命科学、农业、地球和环境科学、工程、心理学、社会科学等领域。
    SCOPUS 数据库还有以下几个主要特点：
1 ．可以检索论文被其它文献引用的情况；
2 ．可以检索到上至 19 世纪发表的文章；
3 ．可以检索到互联网上的相关文献。
用户可通过 Scopus 网页右上方红色的“ Register ”进行个人注册，从而利用 Scopus 中的 Alert 推送服务。

今天想起此事，把当时的截屏在此存个档：
1、在基本检索与高级检索之外，单独设作者检索，比较特别。并且作者检索也可以设置推送，可用于跟踪特定作者的检索。

Scopus Author search

2、作者检出结果注明作者的主题领域以及所在单位，便于区分同名者。除列出命中文献数量外，还有作者详细信息链接。

Scopus Author result

3、作者详细信息页面左栏有两部分，Personal 列出作者名称的其他形式等关于其本身的信息，相当于名称规范档；Research 部分有其收录文献数、被引数及合作者数及其链接。右栏是 Documents 的详细列表，可直接链接到文摘信息 Abstract+Refs。

Scopus Author details

看 Scopus 网站上的最新演示，检索界面不见了 Author Search，不知道是不是演示版的简化。另有新发现，也可能是以前没有注意到：

Scopus Refine results
1、有 Full Text 链接。演示没有说明这个文摘索引库中的全文由何而来。
2、检索结果页面上方的 Refine Results，提示与本次检索有关的内容，供进一步限定 limit to 或排除 exclude。共有五个面：出处/题名、作者、发表年、文献类型和主题领域。分面检索潮流中的又一个例子。

搜索我们的历史：为什么百度不做？

百度要去日本搜索引擎市场占一席之地，据说是因为中国的搜索广告市场太小。市场我不懂，但我知道百度在中国还有很多可搜索的内容没有做。

Google在新闻搜索的基础上，推出了新闻档案搜索（Google News Archive Search），把《华盛顿邮报》《国际先驱论坛报》《纽约时报》《福布斯》《时代》等报刊一二百年的全文扫描后上网，让大家按时间搜索查看，为什么百度不可以也摩仿一把呢？

    Google推出图书搜索，与出版社合作时很顺利，但与图书馆合作，就惹上了版权官司。百度很谨慎，只做没有版权问题的“国学”，内容少得可怜；只与图书馆合作搜索书目信息（与北大，与中科院），建最大的中文图书检索库。不知道这个最大的中文书目库是不是已经投入使用，我从来没有在百度的搜索结果中见到过（当然百度我也用得不多）。

    目前虽然很多图书馆都在做古籍与民国文献的全文扫描，但真正做OCR的很少。“百度国学”中的很多内容，其实已经在网上其它地方可以找到，而那些同样没有版权问题的古老报刊，却是真的很难获取。如果百度做了，善莫大焉。
    八十年代，上海书店影印出版从1872到1949年的全套《申报》。为方便利用，其后本馆有不少人参与《申报索引》的制作。一切都是手工的，其中艰辛可想而知。索引陆续出版了若干年，终于没法继续、半途而废了。像《申报》这样的报纸各地应该也有不少，对研究中国近现代社会的变迁很有价值。如果百度接手做这件事，岂不美事一桩？[update 2006/12/15: 1919-1949的《申报》索引已编制完成，出版正计划中]

百度为什么不做呢？繁体字OCR的可用性问题要解决，以现在的技术，应该不是件太困难的事。[update 2006/12/16: CADAL正在做繁体字文献的OCR]
不会是没有图书馆愿意合作吧？如果百度有像Google那样与图书馆合作的意向，我首先自荐本馆。

可定制RSS的图林博客搜索引擎LibWorm

医学图书馆员David Rothman，用医学博客搜索MedWorm.com觉得不错，便向在英国的设计者Frankie Dolan女士建议把同样的方法用于图书馆博客界(biblioblogosphere)。Frankie认为没问题，前提是由David承担日常管理工作。于是David收集RSS Feeds、安排分类、提出一些预制搜索、建议功能与界面，经过三个月的努力，由Frankie完成所有设计，LibWorm公开运行。

    LibWorm目前已有约1400个RSS Feeds。
    最初David咨询了Steven Cohen和Blake Carver，得到了第一批Feeds。那二位是LISFeeds的创建者，LISFeeds现已不复存在，而两年前我们也是从那里开始看国外图林博客的。
    接着David从Amanda Etches-Johnson’s Blogging Libraries Wiki得到了数百个图书馆的博客，并且借鉴了Amanda的分类。
    现在，通过免费注册，用户可以自己把Feeds增加进去。
    当11月25日，当David在自己博客中公开LibWorm时，Feeds数是超过1100，短短数日，就增加了数百。从搜索结果看，就图书馆界而言，比Google博客搜索收录的要广得多。

在1100多个Feeds时，博客800多，还有图情期刊目次及图书馆人士感兴趣的其他信息源。
LibWorm作为专业的RSS搜索引擎，特别值得推荐的是它有多种RSS订阅，满足不同角度的需求：

        每一个搜索结果都可以生成一个RSS Feed，可用于跟踪某一感兴趣专题（这个Google的博客搜索也有，后面两个Google就没有了）。如果订的博客有限，如此可扩大信息来源；如果订的博客太多，时常来不及看，则可选择只看几个博客、某些专题。
        分类（http://www.libworm.com/rss/librariancategories.php）：把博客分成三十个左右的类，如播客、书评、图情杂志、幽默、公共图书馆、法律图书馆、医学图书馆等
        主题（http://www.libworm.com/rss/librarianqueries.php）：David根据图情的领域与一些热点，预制的一些博客内容搜索，如会议、版权、电子书、Library 2.0、Mashups等，据说不是简单的一个关键词。

注册登录后除了可以增加RSS Feed外，还可以使用LibWorm内置的聚合器。David说注册目的是为了未来设想中的社会性功能。（记得谁说过，Web 2.0的特征之一就是要注册!?）
试了一下，目前还没有包括中文。

对LibWorm的介绍，参见：
About LibWorm：上面的故事大多来自这里
LibWorm: Search and Current Awareness for Libraryfold：David宣布LibWorm开张Information Wants To Be Free：LibWorm: Searching, syndicating and aggregating the bibliblogosphere：维基女王Meredith的报道最详尽
Tame The Web: Libraries and Technology: Announcing LibWorm: Search the Biblioblogosphere
Stephen’s Lighthouse: LibWorm

另：最近由于有人提议维基百科删除”Library 2.0″词条，又引起”Library 2.0″概念之争。David针对T. Scott的反对意见，写了一大篇评论，颇受关注。Tame The Web、LibraryCrunch写博文点评，The Shifted Librarian在David博文下长篇留言。