开源与云计算结合的ILS──Koha Express

9月11日,为开源的图书馆自动化系统Koha提供技术支持的LibLime公司宣布,发布新的基于订购的托管服务Koha Express(LibLime Announces New Budget-Friendly
ILS for Small Libraries
)。

Koha原本就是全Web界面的开源软件,进入云时代可说顺理成章。实际上,LibLime公司原就在kohalibrary.com域名下有Koha的托管服务,实例见Live LibLime Customer Koha
installations
,包括学术图书馆、公共图书馆和图书馆联盟。
新闻稿称,Koha Express 运行Koha正式版(目前为3.0.2),是一个全功能的集成图书馆系统(ILS)。
在LibLime的云计算平台上,通过软件即服务(SaaS)方式分发,价格仅299美元/年,含软件安装及托管。目前世界六大洲有愈千所图书馆采用Koha,图书馆采用Koha Express,可以通过Koha开源社区相互支持,可用的资源包括实时聊天、邮件列表及LibLime公司贡献的详细文档。
此产品的目标客户是小型公共、学校及专业图书馆,在经济不景气的情况下,应该很有吸引力。设定数据导入上限为75000数据库对象,也只适合于小图书馆了。299美元的价格不含数据迁移、培训及OPAC定制。提供30天试用。

对于大中型图书馆、图书馆联盟,LibLime在同日宣布提供企业级Koha(LibLime Announces LibLime Enterprise Koha),应该是Koha ZOOM的托管服务LibLime Enterprise Koha。提供云计算服务,对LibLime来说,是不是独立安装更方便维护呢?
网上有演示版,可以实际试用,做增删之类的管理操作。公司称软件仍将保持开源。也就是说,还是可以免费下载到本地安装使用的。

Koha Express和LibLime Enterprise Koha都集成了今年初发布的Web编目平台 ‡biblios(参见数图研究笔记:面向未来的编目平台:biblios.net (2009/1/20))。

Via Library Technology Guides

PS:去年通过辅仁大学毛庆祯教授,了解了一点Koha。毛教授致力于在两岸推广Koha应用,Koha台湾网上论坛,可说是中文的Koha社区。

公共域作品重印服务

    虽然可以免费下载电子书,但还是有人希望读印刷本。公共域作品重印服务(Public Domain Archive and Reprints service)就提供这样的按需印刷服务,提供公共域数字图书一站式检索,重印本每册最大16开、不超过700页,价格$4.99-18.99+$1管理费+运送费,一般24-48小时提供。它的免责声明很有意思:PLEASE NOTE: THERE IS NO WARRANTY OF ANY KIND. IF THE BOOK DOES NOT COME OUT THE WAY YOU EXPECT, DON’T BLAME US.

    一站式检索使用Google定制搜索,包括如下数字图书网站
完全支持(约270万种):
    * Internet Archive(约120万种,部分与Google Books重复)
    * Google Books(约150万种公共域图书)
    * OpenCRS(约1.9万种公共域作品,主要是国会研究服务部(Congressional Research Service)报告[研究美国对外政策很有用])

测试中(约100万种):
    * HathiTrust(约39万种公共域作品,部分与Google Books重复)
    * Universal Library(即“百万册图书”,约60万种公共域图书)

不包含:
    * Project Gutenberg(约2万种公共域图书)
    * WikiSource(约6.9万页)
    以上大概囊括了现有英文公共域图书网站。网站除Google定制检索外,还有浏览器工具栏、小书签(bookmarklet)检索工具,并有移动访问界面。
    对我们来讲,可用此网站的一站式搜索,然后点击链接到相关网站下载原文。或许是非美国IP的原因,查到的Google公共域图书有些无全文提供。
   
    提供公共域图书的网站一般要求非商业使用,本网站由Yakov Shafranovich以个人名义设立,为保证该服务的非赢利性质,Shafranovich宣称2007-2008年度利润均捐赠给Internet Archive──总共是$33.13,竟然精确到美分!(PublicDomainReprints.org Financials for 2007-2008)
    FAQ中提到一些流行概念,如:该服务使用按需印刷(Print on Demond)服务;维持费用包括租用商业云计算(cloud computing)服务的计算能力;用户订书时要注意书名(title)、版本(edition)与印本(reprint),分别对应FRBR的作品(work)、内容表达(express)、载体表现(manifestation)。
   
    网站还列出了其他7个公共域图书重印服务,包括康奈尔大学图书馆书店(康奈尔大学图书馆数字馆藏)和密歇根大学图书馆学术出版办公室(密歇根历史重印丛书),见识了图书馆加入出版业。拥有无版权特藏的图书馆,开展按需印刷服务应该是一个不错的考虑。

从保存图书到保存网络:图书馆的未来?

    最近Keven连发强贴探讨图书馆有没有未来(图书馆有未来吗?再续续三续四续五待续完结篇)。看到加州数字图书馆的网络档案(Web Archives),不知道保存网络是不是图书馆的一种未来?

    互联网时代,图书馆员最早发挥的特长是知识组织,对网站、网页做人工筛选、标引、编目、组织主题目录(CALIS的“学科导航”也属此类)。这种综合或专题的目录继承了OPAC的所有优点和缺点,相对于搜索引擎来说,最大的问题就是没有全文检索,可用性随着搜罗内容的增加而下降。
    图书馆另有专长是保存人类的知识,这是图书馆长久以来承担的责任之一。图书馆经历了保存甲骨、泥版、纸莎草、竹木简、羊皮……纸张、胶卷、磁带、光盘……,在比特时代,增加新的保存载体也是顺理成章的。由于网络内容的不稳定性(统计数据……),现实上也有这种需求。
    如同图书馆不能收藏所有的图书,图书馆也无法保存完整的网络。而有选择地永久保存网站与网页,形成专题,正是图书馆所擅长的。知道国内图书馆也有做这方面工作的,如国家图书馆的“网络信息保存项目”(惜乎一直无法访问),东华大学的纺织特色数据库也有存档网页的部分。尚有一点不明白的是其中的版权问题:图书馆有权保存这些网页并提供服务吗?大家都在做,暂且存疑。

    加州数字图书馆(CDL)的网络档案(Web Archives)是一种托管服务,带有云计算的特征(下述Archive-It类似):
 √ CDL提供存档工具及存贮(Web Archiving Service, WAS)
 √ 专题网络档案(目前包括18个专题,由不同机构建立,以加州本地内容为主,纽约大学图书馆的几个侧重左翼政治)
 √ 收录网站浏览+全文检索

    Web Archives链接了其它公开网络存档项目,各具特色的内容是专题研究很好的参考数据源,实现方式也可借鉴:

综合性的:
    * Internet Archive (IA) 互联网档案(网络存档的元老)
    * Archive-It 为后代保存互联网:收集、管理、检索……存档。目前有881个公开收藏,分为艺术人文、计算机与技术、政府、自发性事件、政治与选举、科学与健康、社会与文化、大学与图书馆八大类。由参与机构从IA制作不同主题的收藏(collections),由IA负责保存。
    * Pandora (Australia) 保存与访问澳大利亚网络文献资源。分18个主题。

保存政府网站受重视:
    * Government of Canada Web Archive 加拿大政府网络档案
    * Library of Congress Web Archives (LCWA, Minerva) LC互联网档案(曾名“智慧女神密涅瓦”)。侧重美国政府与外交,如:2006年苏丹达尔富尔危机、2003年伊位克战争、2001年911事件及美国国会、选举档案等。
    * CyberCemetery 网络墓地。北德克萨斯大学图书馆与USGPO合作,保存现已不存在的美国政府机构与委员会的网站及出版物,提供永久访问。
    * The Stanford WebBase Project 同样侧重收集美国政府网站(目前只能下载,无检索功能)

采用开源软件(CDL工具估计基于同样软件):
    * Harvard Web Archive Collection Service (WAX) 哈佛网络档案收藏服务。试验性项目,目前有三个档案:博客──捕捉妇女之声,日本宪法修正研究,哈佛网站档案。
采用多种开源工具,包括:互联网档案(IA)及国际互联网保存联盟(International Internet Preservation Consortium, IIPC)的Heritrix网络爬虫、Wayback索引工具、NutchWAX检索工具,以及OpenSymphony的Quartz作业调度软件。

特色馆藏数字化与网络存档的结合:
    * UCLA Campaign Literature Archive UCLA竞选文献档案:一个世纪的洛杉矶选举。收集符合要求的网站,并与UCLA特藏的数字化扫描结合。

Via Press Release: California Digital Library [July 21, 2009]
Library Technology Guides: Web archiving service preserves data for the future

[update] 《数字图书馆论坛》2009年第7期话题:网络信息资源保存
网络信息资源保存所面临的问题和挑战

/ 吴振新(中国科学院国家科学图书馆) PDF查看
网络信息资源保存的协作网络研究
/ 吴振新 张智雄 王婷(中国科学院国家科学图书馆) PDF查看
网页变化监测相关技术与方法研究*
/ 高建秀 吴振新 张智雄(中国科学院国家科学图书馆)
PDF查看
网络信息资源保存的编目方法与系统研究*
 
/ 孙敏杰 吴振新 孙志茹(中国科学院国家科学图书馆) PDF查看
基于Web Archive的网页重现方法及应用研究*

/ 向菁 吴振新 孙志茹(中国科学院国家科学图书馆) PDF查看
网络信息采集与保存标准规范研究*
/ 曲云鹏 王志庚 李春明 周晨 李成文(中国国家图书馆) PDF查看
基于网络信息资源保存的生命周期管理研究*
/ 李成文 王志庚 李春明 周晨 曲云鹏(中国国家图书馆)
PDF查看