日志标签 ‘乱花迷眼’

OpenDOAR的机构库统计

2010年12月15日

    已经有好几年,一直觉得机构库已是明日黄花,虽然看着数量不少,但库规模大的不多。最近因种种原因,又重新拾起来看。
    开放存取库名录(OpenDOAR)是了解总体情况的很好入口。网站首页突出显示目前收录超过1800家。曾记下2006年2月5日时为324家,看统计图,2006年以后似乎发展势头很好,一直在平稳向上。

查找
可以按主题领域内容类别(文章、图书、会议、数据集、学习对象、多媒体、专利、参考资源、软件、特殊、学位论文、未出版)、库类型(集合、学科、政府、机构)、国家语种软件6种途径交叉查询,每种在查询下拉框中都标明了数量。
按库类型,属于机构库的为1481个

√ 库内容搜索:采用Google定制搜索,而非OAI收割。试下来查不到结果,难道都拒绝Google机器人访问?

√ 库列表:按洲别、国家浏览。方便了解各大洲、各国情况。

统计
可以组合出各种统计图表,缺省的是世界范围的。
OpenDOAR统计一览
    从收录条数看,超过5万的有36个库(2%),其中很多不是机构库,如首位的ERIC(130万条)、第3位的PubMed Central(80万条)、第5位的arXiv(60万多条);也有一些应该是大学机构库,如排名14的英国剑桥大学DSpace@Cambridge(19万多条)、排名19的比利时根特大学学术书目与机构档案(12万条)。
在所有1815个库中,收录1万条以上的共184个库(10%)、5千条以上的共315个库(17%)、1千条以上的共771个库(42%)、5百条以上的共987个库(54%)──不到5百条的611个库(占1/3),还有216个库没有标明收录条数。

———-机构库软件———-
    机构库软件是DSpace(665)一家独大(超过1/3),Eprints(297)其次(近1/6),其后依次是Digital Commons(79),OPUS(54),余下都不超过30,Greenstone(24)第6位,听说过的还有ContentDM(17),Fedora(16),DigiTool(15),竟然还有WordPress(1)。

    最近常被推荐Drupal,有4家采用。查了下,加拿大爱德华王子岛大学的IslandScholar是规模最大的(10142条),说明是Drupal+Fedora,没有OAI-PMH网址。
    IslandScholar看内容是典型的大学机构库。有简单的技术说明(Technical Components),抄录如下:
1. Fedora (ver 2.2.4)
* Lucene – Indexing/searching
* MySQL – Database
* Mulgara – Resource Index
* XACML – Security
2. RuleEngine Framework – Rules for conversion processes
* OpenOffice conversion engine
* Searchable PDF
3. Drupal – ver 5.12
* igital Repository Module
** OpenSource module for connectivity  to FEDORA
** developed by UPEI
* Faculty Authentication with UPEI Credentials
** LDAP Module
* Book Module – Automatic Book menu generation
* Path Module – renaming of URL’s
* SpamSpam Module – obfuscates email addresses
* Printer Friendly Pages
4. Discovery/acquisition of Published Copy
* Sherpa/Romeo -auto-connects to display publisher permissions info for articles
* COINS support
** LibX UPEI Edition
* OpenURL
5. Refworks
* Compiling Collections
* Data Cleanup
* Creation of XML for import into FEDORA.
6. Programming Languages used
* PHP
* XML
* Java
* JavaScript
7. Operating System/Hardware
* SLEZ 10
* Dell PowerEdge
** Dual Quad Core CPU’s
** 16GB RAM

———-链接———-
从数字看开放存取(Open access) (2006-2-8)

中美数图研讨班(4)·机构库,看起来很美 (2007年5月27日)

知道你已经在做机构库了吗——摘评一份详尽的IR调查报告 (2007年5月28日)

国际机构库调查出版 (2007年11月14日)

台湾机构典藏(TAIR) (2008年7月25日)

香港大学投千万建“全民共享”学术库 (2010年06月07日)

天一阁古籍数字资源库

2010年12月8日
书社会里老姜转人民网消息“宁波天一阁古籍全面实现数字化转换 向公众开放”(2010年12月08日),称“所藏近3万册古籍全面实现了数字化载体转换”。内容包括:“阁藏明代科举录370种,有72%是海内孤本;现存的271种明代地方志中,孤本量亦占164种之多,天一阁自2008年以来入选的第一、二、三批‘国家珍贵古籍名录’84部全部囊括其中,所有宁波历代方志、近代学者稿抄本……”,“馆藏的500余部家谱,包括100余个姓氏的家谱……”。更重要的是,“此次古籍数字化通过网络平台的开通,天一阁首次将自己的目录资源在网上公布,读者可以进入网站迅捷查询,也可以浏览、编辑、下载网上的免费资源,给各界读者带来了极大地便利。”
以往在看到类似介绍后去访问网站,失望的时候居多,很多时候是限馆内上网、外网不能使用,也有时是宣传了还没有正式开放。此次倒没有失望,Google到天一阁网站,就进了古籍数字资源库。免费注册,登录后可以浏览图书,目前开放访问共712种,应该不是全部。因为不懂古籍,所以不知道这712种是否属于馆藏精品。
试用一遍,可用性和社会化方面都做得相当不错;检索方面有待改进。
使用权限:
·馆内用户可以输入用户名和密码直接登录,可以浏览和下载古籍。
·新注册用户先注册后,获取用户名和密码,可以正常浏览权限,没有下载古籍权限,如需权限可请求博物馆方在后台变更权限。
检索功能:
1、检索途径:全部、卷端题名、主要责任者、主题、典藏号、出版者、版本类别
2、高级检索:除基本检索途径组合外,还有全文检索、批注检索(用户批注也提供检索!)
全文检索:显示命中题名一览;点击题名,显示某书所有命中片断,命中词为红色(不依页码序,排序方式不明),可直接跳转到命中页。
存在问题:古籍常在每页折口(不知道专业名称)版心处都有题名,导致题名中有检索字时,会出现大量命中片断,如果有其他命中结果,需要在大量结果中筛选。
侧栏功能:
最近浏览(个性化功能)
最近检索(个性化功能)
古籍分类
浏览功能:
1、全部浏览(排序方式不明)
2、古籍分类:侧栏的经、史、子、集导航,可点击其下的二级分类浏览
3、热门浏览(社会化功能)
书目信息:
1、一览表信息:书封(部分为真实封面)、题名、主要责任者
题名、责任者无链接检索功能。
2、细览信息:标识符、序列(所有册次)、主要责任者、主要责任者所属年代、主要责任者责任方式、馆藏地址(天一阁)、典藏号(如:善137)、版本类别(如:刻本)
细览页:
本书所有分册(可直接点击浏览全文)
目录(每种书所有分册目录,可按级别伸缩,点击直接跳转到全文相应页面)
本书精彩批注(读者在书内所加批注,社会化功能)
读者评论(对整书的评论,社会化功能)
按钮:在线浏览、收藏(个性化功能)
原文浏览页面:
页面为flash,Loading比较慢(最近我家网速不好),翻页效果可媲美iBook
部分图书有全文阅读、影印阅读和对照阅读三种选项(全文阅读似为做过OCR的,但全文搜索仍无反应)
目录
放大/缩小(图像)
批注、划线及线条颜色、选词(个性化/社会化功能:批注后共享,没有不公开选项;线条不能保存;“选词”在影印或全文阅读时没有,仅在对照阅读时出现,但只对影印页面有效,选中的词作用不明)
全屏
全文搜索(未起作用)
选择册次(逐种阅览,较一般逐册方式更合理)
用户中心(个性化功能):
下载(最近浏览)
收藏
点评
批注
书架(与收藏相同?)
检索历史(最近检索)
天一阁古籍数字资源库·对照阅读

[update 2010-12-9]中国广播网消息:天一阁藏书走向网络 全球读者可在线阅读(2010-12-09):“天一阁现有藏书30万册,其中有不少古籍孤本入选国家珍贵古籍名录。这次实现数字化的古籍共有3万册,全部为天一阁的镇馆之宝”。

大英图书馆开放数据服务

2010年8月25日
大英图书馆(BL)宣布开放数据服务(Free Data Services),包含二方面内容:
√ Z39.50
包括大英图书馆全部目录或英国国家书目,MARC 21格式。
用户需注册,并承诺非商业用途,然后通过得到的用户名与密码访问。
√ 数据集
作为向图书馆界之外开放元数据的一部分,开放大英图书馆目录与英国国家书目供研究使用,以RDF/DC格式的XML文件提供,依创作共用之“非商业-相同方式共享”协议。
大英图书馆正调查以关联数据构造其目录信息的多种可能性,并与若干组织合作,探索使书目元数据以关联数据方式提供的问题。
———-评论的分割线———-
这是继今年4月匈牙利与德国国家图书馆先后宣布以关联数据发布书目/规范数据以来,又一个跟进的国家图书馆。虽然还只是提供XML文件,没有直接发布,但已经表明了态度。肯定会让关联数据的拥护者大为振奋的。
另一方面,虽然要MARC去死的呼声不断,目前MARC对图书馆界仍是不可或缺的,对编目员更是至关重要。前些年做《海外上海研究书目》时,数据源没有选择收藏颇丰的大英图书馆,根本原因就是它没有提供Z39.50方式,无法有效地获取数据。如果当年BL有Z39.50服务,这个书目肯定会更完善。
———-来源的分割线———-
现在几乎要到Google Reader只看People you follow的程度了──其实是在Lee Kai的Google Buzz分享里看到的消息。
Resource Shelf (August 24th, 2010)

关联数据的图书馆应用问题

2010年8月22日
明天(2010.8.23)即将召开“2010图书馆前沿技术论坛:关联数据与书目数据的未来”,书社会中关联数据的讨论方兴未艾。虽然仍是门外汉,但对此一直颇感兴趣,也谈点想法。
对于关联数据的图书馆应用,我的理解有两个方面:一是图书馆发布,一是图书馆利用。
一、图书馆界以关联数据发布自己的信息,供本身或其他领域采用
除了国家图书馆或大型联合目录,大部分图书馆没有自己独特的信息需要以关联数据形式发布,无论是书目还是规范数据。
关联数据需要用URI(统一资源标识符)命名数据实体,现在图书馆界对很多实体并无统一的标识,因而普通图书馆即使把自己数据发布为关联数据,其标识还需要有机制与其他实际同一对象的标识进行关联……
特藏可能是一般图书馆可以用关联数据发布的信息。只是由于网络生态,大部分国内图书馆的特藏即使数字化了,仍然是养在深闺。不过,由于关联数据在本质上还是元数据,以关联数据形式公开发布信息并不影响资源的访问,只要对最终链接到的数字资源本身做访问限定即可。
接下来的问题是:图书馆发布的关联数据被应用的情况。Keven汇总了“图书馆的关联数据应用”,说明了图书馆以关联数据开放自己数据的情况。那么,这些被开放的数据得到应用了吗?又是如何被利用的?
二、图书馆利用已经发布的关联数据,为自己的服务增值
基于前述理由,我以为大部分图书馆应该是关联数据的用户而非提供者。那么,目前有哪些已经公开发布的关联数据可以应用到图书馆领域?有没有实例?
想像中最初级的应用如:在OPAC或网络资源导航中给有关人物、地点、主题、作品等提供扩展的链接?还有没有更好的应用?
———-分割线———-
图书馆发布与利用关联数据的技术,是自己接下来需要关注的问题,夏翠娟在会上有“用Drupal实现关联数据的发布”的报告。
我的“新编目标准RDA与关联数据”基本上是对Karen Coyle文章的解读,定型后再放链接(RDA Vocabularies for a Twenty-First-Century Data Environment. Chapter 4, RDA in RDF. Library Technology Reports, v.46, no.2, p.26-36)。[update 2010-8-27 PPT链接

五花八门的数字图书馆证书与学位课程

2010年7月10日

今天在UIUC听图情学院副院长、ASIS&T现任主席Linda Smith讲图情教育中的数字图书馆学。除详细介绍该院数图证书外,还提供了其他类似证书与课程的信息。按图索骥,汇总如下:

1、伊大图情学院:数字图书馆高级研究证书(CAS, Certificate of Advanced Study)
应用性证书。也可通过远程教育修单门课程,远程是实时在线听讲,而非在线课程。每年10来个学生,无入学考试,只要有硕士学位。
4核心课程+4选修课+1项目Project,40个学分,1-2年完成。
(1)核心课程(必修课)
系统分析与管理
数字图书馆导论
信息建模
元数据理论与实践
(2)选修课:23门课供选,举6门课为例(后两门为新课)
电子出版
信息存储与检索系统实施
信息系统界面
信息政策
数字保管基础
理解多媒体信息

2、亚利桑那大学:数字信息管理研究生证书项目
6门在线课程:
数字馆藏概论
应用技术概论
管理数字信息环境
数字馆藏保存
数字馆藏进阶
毕业设计(Capstone)

3、雪城大学:数字图书馆高级研究证书
要求18学分(每门课3学分):
(1)核心课程3门(9学分):
数字图书馆
创建、管理与保存数字资产
规划与设计数字图书馆服务
(2)选修课程(9学分):20门常年课程,12门其他课程

4、爵硕大学:硕士后数字图书馆专家项目
6-9个月完成,5课程、15学分
(1)必修课3门
信息获取与资源
数字图书馆
数字图书馆技术
(2)选修课2门:
面向资源3门(内容表达、元数据与资源描述、数字参考服务)
面向系统4门(数据库管理导论,人机交互,信息检索系统,信息架构)

5、数字图书馆学习国际硕士
二年制硕士课程,由三个欧洲国家大学合作,即挪威奥斯陆大学学院、爱沙尼亚Talinn大学、意大利Parma大学。
6门课+学位论文,每门15欧洲学分(共120学分)
第1学期:研究方法与科学理论,数字文献
第2学期:信息与知识管理,人力资源管理
第3学期:数字图书馆获取,数字图书馆用户与使用:定性与定量评价
第4学期:学位论文(30学分)

6、数字图书馆课程发展
由国家科学基金会NSF资助,2006-2009年项目,由弗吉尼亚理工及北卡大学合作。因为有国家资助,开放了一些课程信息,包括十个模块
概述
数字对象
馆藏发展
信息/知识组织
架构
用户行为/交互
服务
保存
管理与评价
数图教育与研究