机构库开源软件Hydra改名Samvera

Hydra是基于Fedora的开源软件,可用于机构库或特藏库等。Hydra为希腊神话中的九头蛇,作为项目显示其多用途。Samvera则为冰岛语“亲密无间”,表达协同工作。

Hydra is now Samvera (7 July 2017)(Digital Preservation Coalition 新闻)
Hydra项目始于2008年,由英国赫尔大学、美国弗吉尼亚大学、斯坦福大学和Fedora发起,目前有35个成员参与软件开发与支持。可根据需要部署,包括本地定制工具套件 Hyrax,通用全包解决方案 Hyku,多媒体库 Avalon
考虑到现在已不再是一个项目,为反映社区的重要性,成员同意改名为Samvera社区,反映软件未来通过协作活动发展及持续的相互支持。

Samvera

官网:http://www.samvera.org
Samvera是草根开源社区,为图档博创建最佳的经典数字资产管理解决方案。针对不同内容类型,提供灵活、丰富的用户界面。

Samvera基于4个主要组成部分:
Fedora存储库软件,提供健壮、持久的存储库层,维持和管理数字对象管理。
Solr索引,提供快速访问有关机构资源的信息。
Blacklight,Ruby on Rails插件,在Solr之上,提供分面搜索、浏览和定制的对象视图。
Samvera宝石:Ruby on Rails组件,集成构建基块,形成完整、灵活且可扩展的数字存储库解决方案。

SAMVERA PARTNERS
网页上部为成员名录,下部为非成员但使用产品的机构,以下几个有使用Hydra制作的机构库/特藏库链接:
* Digital Commonwealth (Massachusetts Collections Online) (https://www.digitalcommonwealth.org/) 图档博大型库
* Johns Hopkins University (levysheetmusic.mse.jhu.edu/) 乐谱特藏库(在线浏览、PDF下载)
* Museum of the Performing Arts (MAE) of the Theatre Institute of Barcelona (colleccions.cdmae.cat) 大型库
* Northeastern University (repository.library.northeastern.edu) 机构库(示范性)

关于Hydra,参见论文
几种典型新型开源机构知识库软件的比较分析 / 张旺强 祝忠明 卢利农(中科院国家科学图书馆兰州分馆). 现代图书情报技术, 2014-02-25
开源仓储软件在清华大学图书馆的研究应用与思考 / 曾婷; 董丽; 邹荣; 姜爱蓉 图书馆杂志 2012-05-15
文末“思考与建议”值得参考,特别是“永久的数据,短暂的系统”。

ContentDM试用记

一直很关注OCLC,却很晚才知道它的数字馆藏管理软件ContentDM,也就是我们一般所谓的自建数据库软件,据介绍已有近2000个组织在使用。
Marcia的数字馆藏元数据课程(Metadata for Digital Collections)中有一节是使用ContentDM,她发来教学用的用户名与密码,让我有机会做了一次试用。顺便推荐此课程,详尽的大纲附PPT、参考资料、练习等丰富资料与链接。

回到ContentDM,教学指导Using ContentDM让人喜欢,因为只要简单地跟着做,一下就上手了。指导包括三个部分:
一、看一个用ContentDM的实例(明信片数据库),感受一下,并下载图片作为接下来自已练习建库时上传的数字对象(自然元数据也可以照抄)。

二、在已有库(Colletion)中加入2条数据(Item),发布后即时看效果。这部分没有对软件功能的逐个介绍,完全是实际操作,指导性强、很容易上手。只要三个步骤:
添加item(数字对象及元数据)──审核并索引──浏览结果(View Collection)

三、修改库(Colletion)的字段,也就是元数据方案或应用文档。系统缺省设置是DC元数据,可以直接使用,也可以修改。虽然建库首先是设计元数据方案,但因为之前的课程已经学习过,在学习软件使用时先看发布效果,而把元数据设计优化部分置后,能使学习者更有兴趣。

ContentDM当然不只这么简单的功能。在跟着指导做完后,把软件的其他功能浏览了一遍,有些还试做了一下。软件有三个层次:Server, Collections, Items。服务器层没有访问权限,馆藏层不能新增,其他功能基本都可用。用户界面的功能也试用一遍,有收藏及检索提示功能。整个过程做了截图(ContentDM, 2010-04-15)。

[截图更新2010-04-18]

Collection功能
配置(介绍文字,访问限制,图片分辨率、PDF转换等)
字段(字段名、DC对照、数据类型、完全显示否、索引否、显示否、必备否、控制词表)[update 2010-04-18 如果选控制词表,用非控词审核将无法通过]
图像显示
统计报告
导出(元数据,Tab分隔文本、XML或OCLC SiteSearch)
帮助

Items功能
审核(含编辑、删除[update 2010-04-18:可选审核、索引同做])
索引(添加、审核、编辑、删除后[update 2010-04-18:可设置在空闲的时间做])
添加(审核后发布)
编辑(及删除)[update 2010-04-18 编辑时可将多个记录组成复合对象]
替换(单字段或所有字段元数据,或更改字段)
锁定记录管理(解锁)
帮助

用户界面功能
浏览
高级检索(检索无结果时有提示)
显示设置(布局、排序、每页显示数及色彩)
我的收藏

要有更深入的体验,恐怕得仿真做一个库,才知道功能是否够用、用起来是否方便。目前控制词表有十个可选,也可从文件导入。

说明:
OCLC网站上CONTENTdm可以申请60天免费评估。

批量更名专家·行业规范

    各行各业都有自己的规范,训练有素的人员必定严格遵守这些规范。
    每次去修表,修表工的最后一道步骤总是对表,把时间校正──哪怕我修的是表带。
    图书积压,领导决定套录记录不必修改,可老资格的编目员看到不符合要求的记录总忍不住去改一下──哪怕不计算工作量。
    前些天,见识了电子书制作的规范。    

    本馆有一批用清华同方TPI制作的电子书,扫描文件名形如XXXXX.001系列。现在打算制作成CADAL格式的电子书,首先需要将文件名改为8位流水号。一位同事在网上找来“批量更名专家(RenameWiz)”,只要选择“替换”,将原来的“XXXXX.”替换成5个0就搞定了。
    制作电子书的同事在转换过程中,发现一些书原来的文件名不规范,或者不是从001开始,或者中间跳号。她看不过眼,逐一改成从1开始顺序编号的──哪怕改得手酸脖子痛。
    我以为那是无伤大雅的,不影响最后阅读就可以了。不过既然她有自己的规范,也应该支持──看一下批量更名专家,有“序数”改名功能,只要把开始字符设为00000001,增长设为1,一下就搞定了。
    冰雪聪明的她立刻悟出──都用这种方法,不是简单得多?正是!原来就想着要“改名”,没想到还可以用“序数”方式改名。

    如果你也有大批文件需要改名,强烈推荐“批量更名专家”──还有很多功能,随你想怎么改,估计只有想不到、没有做不到的。