user_script – 编目精灵III

图林Library 2.0很热闹，最近刚被选为下届北美专业图书馆协会(SLA)主席的SirsiDynix公司副总裁Stephen Abram对此也一直是谈兴甚浓，但OCLC只谈Web 2.0，绝口不提L2。
Web 2.0有很多特征，其中之一是“数据是下一个Intel Inside”，不知道是不是确切，我把它译为“数据核心”――对图书馆来说，内容是基础，围绕着自己特有的内容来提供丰富的用户体验，才是Web 2.0时代的生存之道。而OCLC积数十年而成的联合目录数据库WorldCat，5千万书目、10亿馆藏，就是这样一个独特的“数据核心”。OCLC副总裁、首席策略家Lorcan Dempsey一直在呼吁“让数据起作用”，数据挖掘是研究部的重头戏。

3月24日，OCLC正式公布了研究数年的数据挖掘研究成果之Audience Level，通过对WorldCat中馆藏数据的挖掘，结合其FRBR研究的xISBN项目，提供作品（而非某一出版物）的读者对象。
在书目记录中，虽然为“读者对象”代码预留有位置，但西文编目的传统是除了儿童读物，一般不作标记。为获取读者对象信息，OCLC转而利用其独特而庞大的馆藏数据，通过对不同类型的收藏馆加以不同的权重，以数字方式提示文献可能的读者对象。

这个项目有什么意义呢？按OCLC的说法，可用于以下三个方面的进一步开发：
1、information relevancefor retrieval（信息检索相关性）
2、reference services (including readers advisory)（参考服务，含读者咨询）
3、collection development（馆藏发展）

提供三种利用途径：

1、用户界面
输入WorldCat号或ISBN，在页面的最下面，会以图示法显示该作品的读者对象（从中小学级Schooler到学术级Scholar）

2、Web服务
大家可以在自己的网页中加上如下链接，显示作品的读者对象信息（我以《哈利?波特与魔法石》为例，可以用WorldCat号或其它ISBN代替这里的0590353403）：
http://researchprojects.oclc.org/al/al.xml?oclcno=0590353403

如在后面加参数“&manifest=true”，则显示所有版本的读者对象信息，如：
http://researchprojects.oclc.org/al/al.xml?oclcno=0590353403&manifest=true

[update (2006-3-25 17:00)]
以上只是简单的示例。实际上Web服务提供了最广泛的应用可能性，只要有足够的想象力，任何人都可以将这一服务结合进自己的应用。最原始的方法如在自己的OPAC中显示某书的读者对象，高级一点的如评估本馆西文馆藏的学术层次……

3、Greasemonkey用户脚本
在Firefox浏览器中安装Greasemonkey扩展后，再分别增加用于Open WorldCat或者亚马逊的用户脚本，在访问这两个网站时，脚本会自动在它检测到ISBN的网页中插入读者对象评价信息。

看OCLC研究部主页的那一长排研究项目，就不会奇怪为什么它会成为本行业的龙头老大了。

Audience Level prototype资料：
新闻发布：New OCLC Research prototype assesses likely audience for resources in WorldCat, the world&aposs largest catalog of library resources

使用说明：Learn more about the Audience Level prototype

算法介绍：Audience Level project overview

经典回放：
Lynn Silipigni Connaway, Edward T. O&aposNeill and Chandra Prabha. 2004. “Estimating Audience Level of Monographs Using Holding Patterns in WorldCat”. Presentation given at Library Research Seminar III: Learning and Growing; Inquiry into Librarianship, 14?C16 October 2004, Kansas City, Missouri (USA). (PowerPoint : 32MB/29slides)

其它相关资料：
Lorcan Dempsey: Making data work harder
Lorcan Dempsey: Making data work – Web 2.0 and catalogs

Greasemonkey中文手册

Jackie像几位一样不得已搬了家，刚到新家就摆出了好东西让大家共享。“轻巧的图书馆Greasemonkey应用”集中介绍了Jon Udell的LibraryLookup项目的Greasemonkey应用。
Greasemonkey是一个Firefox浏览器扩展，它有通过编写脚本来改变被访问网页的功能。安装后，就可以在Firefox浏览器中安装各种专门的“用户脚本”（Javascript代码）。LibraryLookup项目的前述Greasemonkey应用，就是一种专门的用户脚本。安装完成后，用Firefox浏览器访问亚马逊时，在图书信息页面，会自动插入相应图书馆的馆藏信息。

这么好的功能，可惜我们不是那几个Geek所在（或所帮助）图书馆的用户，所以无福享用。不过我们可以退而求其次，无需安装Greasemonkey扩展，无需使用Firefox浏览器，经过一番定制后，在访问图书网站时，只需多一个点击链接动作，照样可以享受LibraryLookup带来的便利。
LibraryLookup原来是一个bookmarklet，它也是一段小程序，可以像书签一样加入你IE、Firefox或其它浏览器的收藏夹，在访问亚马逊（或其它有图书信息的网站）的图书信息页面时，点击该链接，便可即时检索相应图书馆的联机目录（OPAC），得到图书馆馆藏信息。它不改变原来的网页，而是弹出一个检索结果窗口。

在LibraryLookup项目主页，有一个bookmarklet生成器（bookmarklet generator），可以自己定制想要检索的图书馆目录。需提供的信息是（以清华大学图书馆OPAC为例）：

Vendor：所用的图书馆集成系统（innovative）。因为是美国人设计的，所以都是些外国系统。如果非图书馆员，不知道图书馆采用的是什么系统，可以点击系统名称后的实例（example），看看自家图书馆目录看上去跟哪个一样（弄错了后面还有机会更正）。
Base URL：图书馆目录的基本URL（http://innopac.lib.tsinghua.edu.cn）。分析图书馆目录检索结果的URL，取OPAC的URL。
Library Name：图书馆名称（Tsinghua Library）。详简随意，是bookmarklet显示的名称。

完成上述三个部分后，按“Build your own LibraryLookup bookmarklet”按钮。

    换窗口后，首行让你先测试一下你所提供的信息是否能够获取信息。由于LibraryLookup通过识别页面的ISBN实施OPAC检索，所以如果没问题，你将会看到图书馆目录的ISBN检索页面；当然如果图书馆收藏有该ISBN的图书，则直接显示该图书信息。如果有问题，后退到前一页面修改。
    完成后，拖动图书馆名称链接（本例中为“Tsinghua Library”）到浏览器工具条中的“链接”或“收藏夹”。这时可能出现一个“安全警报”窗口，选“是”继续，即完成。
    在网页的下面有Bookmarklet小程序的全文，反正我是一窍不通。不过如果熟悉Javascript，估计这三行（主要是第一、二行）也很容易破译。改写一下，即使是用于国内图书馆集成系统，应该也是没问题的。

做完之后，就可以找网站试用一下，看看效果了。比如亚马逊、比如Open WorldCat、比如douban（英文版），注意必须是单种图书信息页面。出现结果很爽，比上清华馆网站查速度不知快多少。

同样遗憾的是，中文图书网站不顶用，比如当当、卓越、以及中文豆瓣。由于英文豆瓣可以使用，所以我推测可能是字符集问题。
如有Javascript行家解决中文问题，再增加更多国内图书馆集成系统，那就可以造福广大的中文用户了。

当然，如果能够做出Greasemonkey版的LibraryLookup生成器，那就更好了。那些Javascript代码在Jackie的链接中找，Jon本人的代码在此。Jon这么久都没有推出Greasemonkey版的生成器，大概不那么好做。

资料：

有关LibraryLookup项目的各种信息，见其主页（2002年的创意噢！）：
Jon Udell: The LibraryLookup Project
Jon本人谈LibraryLookup Greasemonkey script见：
Sufficiently simple technology

标签： user_script

OCLC发布新的数据挖掘项目――读者对象

在图书网站查图书馆目录――也来介绍LibraryLookup项目