存档在 ‘若有所思’ 分类

OCLC推出实验分类服务Classify

2008年7月11日

    OCLC前些日子刚推出了针对LCSH、MeSH、TGM(图形资料叙词表)等的控制词表术语服务(Terminology Services),接着又推出了实验性分类服务(An experimental classification service),这是一项基于WorldCat数据挖掘的原型服务Classify,采用OCLC的FRBR作品集算法,提供作品的DDC、LCC及NLM分类号。
    从Classify检索入口,可以通过ISBN、ISSN、OCLC控制号、UPC(通用产品码)或者作者/题名进行检索。由于很多作品都有不同版本,所以分类号也可能呈现五花八门的情况。
    目前提供的信息有:
基本信息:题名、作者、体裁、版本、收藏馆数
分类信息(DDC、LCC、NLM):最常用分类号及收藏馆数,最新分类号及收藏馆数,最新分类法版本、分类号及收藏馆
分类号分布图:分为所有及DDC、LCC、NLM的分布
版本详细信息,包括题名、作者、语种、收藏馆数、MARC类名、分类号等

    其中最抢眼的是分类号分布图。同一种书,分类号大多数情况下差别不会太大,于是分类号分布饼图一般情况下就象游戏中那个张着大嘴吃豆子的小家伙。下面特意找了个有很多不同分类号的例子截图

    昨天看到时没觉得这个分类服务有什么用,今天看到David说这是个“快速、简单获取分类号的途径,而无须是OCLC成员”,方才想到原来WorldCat是不显示分类号的。David在一个专业馆工作,在美国很多小馆无钱参加OCLC,而查LC的命中率又不够高,如同我当初,千方百计、削尖脑袋找免费的数据来源。
    Classify提供最新分类号、分类法版本也是挺有用的,因为有可能反映了分类法的更新,常常新分类号更接近最新理解。看了几个例子,或许都不是医学方面的,没有见到NLM号。

   不管“有用”、“没用”,可以看到OCLC在如Lorcan Dempsey所说的那样,不断地"make data work hard"。难怪OCLC尽管属于图书馆行业,却已连续三年名列《计算机世界》最佳IT工作单位(Computerworld’s Best Places to Work in IT),并且排名从2007的第86位上升到了2008的第51位。

   另:在WorldCat.org查上图中的书“Stilwell and the American experience in China, 1911-45”,共14条,而且首条只显示10版本(而不是上图的15),可见WorldCat.org“版本”部分的FRBR化做得还不到家──10版本中没有包括检出的几个中文译本,即《史迪威与美国在中国的经验》《史迪威与美国在华经验》《蔣介石的外國高級參謀長 史迪威》。

参见:
Class numbers on works (July 09, 2008) from Lorcan Dempsey’s weblog
Classify from OCLC (July 10, 2008) from Catalogablog

从可视虚拟书店到虚拟现实图书馆?

2008年6月29日

    2008-6-16,加拿大人Chris Thiessen发布了名为 Zoomii 的网上书店。访问这个虚拟书店,如同走进摆满图书的实体书店(满墙按类摆放、展示书封的图书),在书店中随便逛(用鼠标放大缩小、上下左右移动),从书封看有点意思的拿下来翻一下(点击看详细信息),再决定是否购买(最终通过Amazon购买)。Zoomii通过Amazon的Web服务获取图书数据,如果用户最终由Zoomii去了Amazon买书,Zoomii得到抽头。

    Huddersfield大学的Dave Pattern看后产生联想,立刻动手,不过十来天,已经在他们基于Horizon的OPAC上加上了封面浏览的虚拟书架。在OPAC检索结果页面下方,可以看到相邻图书的封面,感觉上就是在书架上浏览左右两边的图书。直接点击某个封面,就切换到另一条书目记录了。

    Dave自谦目前尚为"crappy prototype"(废物原型)。有留言问如何实现,称原就使用Amazon的Web服务获取封面,并记录哪些书有封面图片。现在的做法是由馆藏新建一个索引,得到按DDC分类号排序的一串书目记录号,并与是否有封面图片结合,在此基础上做成虚拟书架。
   
    Huddersfield大学早就试验过在OPAC上显示图书架位的功能,现在又试验显示图书封面的虚拟书架。有此基础,在未来如果做成虚拟现实图书馆(Virtual Reality Library)大概也是顺理成章的事了──在标示有索书号的图书馆布局图上,点击感兴趣的书架,逐本浏览架上的图书,看到感兴趣的取下来看看(点击看详细信息),想借的话先办保留,如果被借出了那就办预约。

    虽然自己在图书馆工作,但更喜欢网上书店。昨天根据儿子老师开的书单想在网上书店购买,结果大部分书因为年代久远而“缺货”,因而不得不承认,图书馆在相当长的时间内还是离不开的。
    前些日子看到一种观点,提出什么时候在图书馆借书能够像在网上书店买书那样方便。如果想像中的虚拟现实图书馆能够把虚拟与现实结合,提供文献寄送服务,相信会有更多人离不开图书馆了。当然,除了对残疾人服务,我不会要求免费寄送。

参见:Visual virtual shelf browsing (2008-6-27) from "Self-plagiarism is style"

OCLC的新一代编目产品

2008年6月23日

    OCLC副总裁Lorcan Dempsey是LC书目控制未来工作组成员,但在工作组长达一年多的活动期间,他几乎没有在自己博客上谈论过小组内情。即使在报告发布以后,好象他也没有在博客上发表过自己的意见,印象中只提供过一个OCLC对报告意见的链接。但在小组的报告草案于2007-11-30发布不久,OCLC立刻在网站上挂出了一个名为“新一代编目”(Next Generation Cataloging)的试验计划(DC.Date.Created=2007-12-11),其中引用了报告草案的建议。
    这个新一代编目试点项目,就是抓取来自出版社的ONIX数据并对质量加以强化,以及早加入WorldCat。显然项目的结果是,OCLC将由用户贡献数据的分销商转而成为原始数据供应商──OCLC将此项目归在试验中的产品(ProductWorks),顺便可以看看OCLC琳琅满目的试验中产品。
    项目运作过程:
· 合作出版社/供应商(Ingram图书集团、Hachette图书集团、普林斯顿大学出版社、Taylor and Francis)提供ONIX格式的信息。OCLC将数据转换为MARC格式加入WorldCat,并尽可能通过数据挖掘与数据映射的方式自动强化数据。强化后的元数据以ONIX格式返回给出版社/供应商,以对OCLC的强化作出评估。
· 合作图书馆(芝加哥公共图书馆、凤凰城公共图书馆、MIT图书馆、俄亥俄州立大学图书馆)评价通过上述过程加入到WorldCat中元数据的质量,反馈其用于图书馆技术服务流程的适应性。

    据OCLC负责WorldCat与元数据服务的副总裁Karen Calhoun在不久前举行的“编目未来”会议(The Future of Cataloging: a PALINET Symposium, 29 May 2008)所作主旨发言“转变之旅:从苟延残喘到蓬勃发展”(Traveling Through Transitions: From Surviving to Thriving,PPT),试验计划将于本月结束,目标是在2009财政年度正式发布(p.46)。

    在即将举行的ALA的2008年会上,6月29日将会有一场名为“OCLC编目新方向”(New Directions in Cataloging at OCLC)的专场,介绍新一代编目项目的试验结果。再顺便看一看OCLC在年会上排得满满的四天活动日程,Big O真是牛得让人无话可说。

学术图书馆也用开源ILS──UPEI舍Unicorn用Evergreen

2008年6月10日

    看国外图书馆采用开源ILS的报道,看得早已麻木。不过今天得知加拿大爱德华王子岛大学(UPEI)成为第一家采用Evergreen的学术图书馆,而且是一个月内搞定,还是感到些兴趣。
    UPEI馆长Mark Leggott在自己的博客上用系列博文记录了迁移的过程(Vendor to Open Source ILS in 1 Month,这是第1篇),还在PBWiki上建有迁移维基Wiki Migration Page,可详细了解整个过程。
    该馆原来用Sirsi的Unicorn,合约到期,决定迁移到Evergreen──5月上旬在测试服务器上安装Evergreen,开始将书目记录由Sirsi迁移到Evergreen,6月4日正式上线。应该是趁着暑假读者服务低谷吧。

    以上是操作过程。不知道决策过程。
    从博文看馆长是开源软件拥趸,做事随性,好象还常做拍脑袋的事(第2篇“Our Project Planning Document”竟是一封email,文首引言:Yea right – like how many people who know me think we actually have a planning document?),换系统这样的决策不至于随便拍脑袋吧?

    UPEI图书馆对新图书馆目录及系统的介绍:New Library Catalogue and System – Updated June 4/08)
新系统称为IslandPines,是该校名称与Evergreen发源地Georgia Library PINES Program的结合吧。
    新目录入口:http://islandpines.roblib.upei.ca/

    谈及使用开源软件,很多图书馆可能会感到担心,或者担心自己没有足够的技术力量,或者担心软件的稳定性,但国外图书馆为什么不担心?答案是,他们有很棒的Geek,可以自己搞定?那只是少数图书馆。真正的答案是,他们有开源软件公司做技术支持。UPEI就是由Equinox软件公司做技术后盾的,而该公司创始人正是Evergreen的开发者。
    因为是开源软件,Equinox并不具有垄断性质,如果不满意其服务,完全可以在不更换系统的情况下换一家提供服务的公司(如LibLime,也提供对Evergreen的支持)──这也正是很多国外图书馆选择开源软件的重要原因之一。

Via:
Wow! from "Self-plagiarism is style" by Dave Pattern
Academic Evergreen from Lorcan Dempsey’s weblog

推荐:Evergreen社区:http://open-ils.org/

PS: 很遗憾地说,无论是Mark Leggott的博客还是该馆的迁移维基,拜GFW之赐,都无法直接访问。

伯克利协定与图书馆集成系统通用API

2008年6月9日

    数字图书馆联盟(DLF)于2007年夏成立图书馆集成系统发现界面专责小组(ILS-DI),分析在传统ILS与互联网发现应用之间达到有效互操作的问题,致力于提出一个技术解决方案──简言之,就是确定ILS以何种方式向图书馆与互联网开放。其背景是:越来越多的图书馆已经采用或正在开发独立于ILS的外部发现应用,包括OPAC前端,集成搜索服务、标签服务、社会化软件等。

    2008/3/6,DLF代表与主要图书馆应用厂商在加州伯克利讨论由小组提出的技术建议草案,即所谓“伯克利协定”(Berkeley Accord)。建议针对将ILS的数据和服务与支持用户发现的新应用集成的标准界面,允许图书馆部署新的发现服务以满足Web2.0时代不断成长的用户体验,充分利用高级ILS数据管理与服务的优势,催生新一代图书馆管理与发现应用中强大的创新社区与市场。
    与会者同意,通过部署特定推荐标准,经由开放协议与技术,支持一系列基本功能,包括:
1、收割(Harvesting):收割馆藏数据记录,完整的或基于最新变化的,核心书目记录或与馆藏、流通数据结合的记录。通过OAI-PMH接口实现。
2、可获得性(Availability):实时查询书目项的可获得性。通过ILS-DI专责小组指定的简单REST接口实现。
3、链接(Linking):固定方式链接到OPAC中任何项。通过ILS-DI专责小组为OPAC定义的URL模板实施。

    签署协定的厂商有(undersigned by):
   1. Talis
   2. Ex Libris
   3. LibLime
   4. BiblioCommons
   5. SirsiDynix
   6. Polaris Library Systems
   7. VTLS
   8. California Digital Library
   9. OCLC
  10. AquaBrowser
    唯一弃权的厂商(Abstention):
   1. Innovative Interfaces, Inc.

    经过三个月时间,ILS-DI于2008/6/4发布了长达78页的正式技术建议(DLF ILS Discovery Interface Task Group (ILS-DI) Technical Recommendation)(PDF, 269KB),包括四个层次的互操作共25个功能:
Level 1: Basic Discovery Interfaces
• HarvestBibliographicRecords (Data Aggregation, section 5.3.1)
• HarvestExpandedRecords (Data Aggregation, section 5.3.2)
• GetAvailability (Real Time Search, section 6.3.1)
• GoToBibliographicRequestPage (OPAC interaction, section 8.3.1)

Level 2: Elementary OPAC supplement
All of the above, plus
• HarvestAuthorityRecords (Data Aggregation, section 5.3.3)
• HarvestHoldingsRecords (Data Aggregation, section 5.3.4)
• GetRecords (Real Time Search, section 6.3.2)
• Search (Real Time Search, section 6.3.3)
• Scan (Real Time Search, section 6.3.4)
• GetAuthorityRecords (Real Time Search, section 6.3.5)
• Either OutputRewritablePage or OutputIntermediateFormat (OPAC Interaction, sections 8.3.2 and 8.3.3)

Level 3: Elementary OPAC alternative
All of the above, plus
• LookupPatron (Patron Functionality, section 7.2.1)
• AuthenticatePatron (Patron Functionality, section 7.2.2)
• GetPatronInfo (Patron Functionality, section 7.2.3)
• GetPatronStatus (Patron Functionality, section 7.2.4)
• GetServices (Patron Functionality, section 7.2.5)
• RenewLoan (Patron Functionality, section 7.2.6)
• HoldTitle (Patron Functionality, section 7.2.7)
• HoldItem (Patron Functionality, section 7.2.8)
• CancelHold (Patron Functionality, section 7.2.9)
• RecallItem (Patron Functionality, section 7.2.10)
• CancelRecall (Patron Functionality, section 7.2.11)

Level 4: Robust/domain specific discovery platforms
All of the above, plus
• SearchCourseReserves (Real Time Search, section 6.3.6; for academic libraries)
• Explain (Real Time Search, section 6.3.7)
• Both OutputRewritablePage and OutputIntermediateFormat (OPAC Interaction, sections 8.3.2 and 8.3.3)

    若干年前,图书馆对ILS厂商除了抱怨无计可施。2005年John Blyberg提出图书馆集成系统客户权力(ILS Customer Bill-of-Rights) ,引来讨论无数,正是这种状况。随着Web2.0的兴起,美国图书馆界竟然能在这么短的时间内通过努力让局面为之一变,真令人赞叹!随着建议在ILS厂商的逐渐实施,ILS通用API将使未来OPAC应用更加多姿多彩。

相关信息:
ILS-DI技术建议网页:宾州大学图书馆John Ockerbloom为ILS-DI小组主席,网站设在该馆。据云技术建议书也将发布在DLF网站。
Peter Brantley’s thoughts and speculations: ILS Basic Discovery (April 4, 2008)
加州大学伯克利分校图书馆Peter Brantley介绍DLF代表与主要图书馆应用供应商在加州伯克利讨论草案的情况,以及DLF对此事的新闻稿“ILS Basic Discovery Interfaces: A proposal for the ILS community”。