知道你已经在做机构库了吗——摘评一份详尽的IR调查报告

    还在想是不是要做机构库?很可能你早就在做而不自知?
 
    远洋过客在“机构库,看起来很美”下留言,告诉我们一个最新的美国IR调查报告,长达167页,数据全面丰富,真是"overall picture",十分精彩!

Markey, K., Rieh, S., St.Jean, B., Kim, J. & Yakel, E. (2007). Census of Institutional Repositories in the United States: MIRACLE Project Research Findings. Washington, D.C.: Council on Library and Information Resources. CLIR Publication No.140, 167 p. ISBN 978-1-932326-28-4 (http://www.clir.org/pubs/abstract/pub140abst.html) (PDF全文,2.9MB)

    调查意在更好的实施IR。项目组甚至想帮助不打算实施者重新考虑IR,在p.77特别列了长达一整页的表(表9.1),或许可以解除有关IR的所有疑惑?
    报告结尾附有针对无计划、计划中、试验中、实施中四种机构的不同问卷,以及IR十个方面的文献评述。

    调查报告太长,抽些感兴趣的图表初初看过,摘评如下:

基本数据:问卷数2147,回复446,回收率20.8%。

p.15 表2.1 IR参与程度
无计划的机构52.9%,计划中的机构20.6%,试验中的机构15.7%,实施中的机构10.8%。
[一半以上机构还没有打算做]

p.17 表2.2 问卷填写者
绝大部分为图书馆人员(馆长74%、副馆长8%或馆员10%)
[可见图书馆承担IR居多]

p.18 表2.3
实施中研究型大学比例最高62.5%,而无计划中比例最高为硕士(43.6%)和学士(33.5%)学校。
[最牛的学校总是走在前头的]

p.23 表2.6 IR责任分担
实施中的图书馆责任分担约85%,试验中的图书馆责任分担近60%,规划中的图书馆责任分担不到50%。
[报告认为这是不同实施阶段的不同,我却把它解读为,随着IR的发展,图书馆在建设IR中承担的责任有下降趋势。或许这种解读是不正确的。]

p.31 表4.1 是否实施过需求评估
实施中机构,58.3%未做过需求评估,试验中机构,65.2%未做过需求评估,规划中机构89.7%未做过需求评估。如果再加上5-12%不知道的,未做过需求评估的比例还会增加。
[可见IR实施的盲目性,并且随着IR的发展,这种盲目性在增加。或者说,看别人都在做,于是自己就不加思索地跟着做。]

p.38 表5.1 机构中的IR数
大部分机构只有1个IR,也有2-3个的,甚至在试验中的机构有4个及以上IR的。
[或许这可以解释为什么ROAR说很多IR基本上是空的——正处在试验中,内容还不多——而这,可能从反过来说明,IR正红火着呢?]

p.43 表6.1 IR中数字文献量
在已经实施的IR中,仅19.4%超过5000,40%以上不到500;试验中的IR,仅8.3%超过5000,近70%不到500。
本项目调查人员还发现,IR规模与其存在年限没有关系。
[或许在最初筹备的文献加入后,就没新的内容了?恐怕红火假设未必成立?]

p.44 表6.2 IR中数字文献类型
无论在实施中还是试验中的IR,唯一数量超过1000的是博士论文
[原来国内图书馆早就都在做IR了——哪家高校没有硕博论文数据库啊?]

p.52 表6.3 IR的授权贡献者
[谁可以向IR提交内容呢?看这个表很有意思,好象什么人都可以——尽管排在最后,但有10%以上允许external contributors]

p.54 表6.4 IR主要贡献者
实施中的教员首位,占33.3%;研究生其次,占20.5%;图书馆员再次,占10.3%。
试验中的也是教员首位,占59.7%;图书馆员其次,占19.4%;档案馆员再次,占8.1%。
[老师的参与度还是最高的,且遥遥领先。不知道是出于制度,还是出于意愿]

p.60-61 表7.1、表7.2 建立IR的益处
按序列出了益处。
[对图书馆肯定是有益的,对所属机构也有益——如果要写建立IR的论证报告,这里罗列的文字与数据就用得上了]

p.62 表7.3 损害成功IR实施的因素
头两项:
1、缺乏某些类型资料的强制贡献规定,如硕博论文,教员预印本
2、贡献者缺乏关于从IR得益的知识
[很幸运,国内高校大致都有硕博论文的强制提交规定]

p.67 表8.1 不计划做的原因
前五位:
其它事情更紧迫87.2%
没有支持的资源71.1%
在评估与自己类似的机构后考虑 65.5%
馆内没有做计划的技术58.8%
在评估与一般机构后考虑 56.1%
[不计划做的机构表现得比表4.1中的机构更清醒些?]

p.78 表9.2 本次调查中证实的以前调查结论
与开头所述表9.1一样,也是一整页的结论。其中有:
试验中与实施中IR都很小
[或者说开始实施时红红火火,但缺乏可持续性?那为什么项目组还要忽悠人去实施呢?固然实施得好有很多益处(表7.1、表7.2),但如果结果并不理想,其中的好多益处不就荡然无存了吗?]

中美数图研讨班(4)·机构库,看起来很美

没探究过“institutional repositories”(简称IR,机构库、机构仓储、机构典藏、机构知识库)的起源。但看到那些比较牛的学校都在做,自己似乎觉得也应该做。
不过,具体到操作层面,首先要考虑数据来源,就积极不起来了。毕竟国内的教师都比较保守,不理解成果在网上可见的益处,有共享意愿者不多;并且国内也没有见到哪个权威部门或学术机构有支持开放存取的政策,没有任何保障数据获取的渠道,反而有版权方面的问题。

听秦健老师讲到IR,原来国外也是图书馆方面一头热,图书馆要拼命游说校长及分管负责人,而教授们并不积极参与贡献。或者说,国内存在的问题,国外也同样存在。她指出,IR在经历了前些年的研究开发热后,现正在退潮。
之前,Paul在讲开放存取时,提到过开放存取仓储注册机构(Registry of Open Access Repositories, ROAR)的一些统计,同样说明了这样的现状:
· 许多IR差不多是空的,IR中的很多文献不是全文
· IR中的文献数量增长很大,但增长已经趋平

今天是数图班的项目汇报,第一个汇报的项目就是IR,主要介绍北京理工大学建设中的学术资源仓储。提问到版权问题,回答的解决之道是提供摘要,链接全文。同时报告者也承认进展缓慢。
国内在IR上热得慢,冷得也慢——至少对我来讲,是第一次听到有关IR的实实在在的不利信息。

关于IR软件,国内谈得较多的大约依次是:DSpace, Fedora, Greenstone和EPrints,其中又以前两者应用较多。此次秦老师介绍了一个新软件:iVia。秦老师介绍该软件功能强大,可自动生成元数据,自动加LCSH、分类,采用DC元数据,可与MARC混用,基于XML……。
IR或许不那么容易做,毕竟还要钱砸下去。但把开源的iVia弄来研究一番,还是可以的。不做用它做IR,还可以做别的数字图书馆项目:
iVia: Open Source Internet Portal and Virtual Library Software

参见:
数字图书馆会议信息二则
中美数图研讨班·开班前胡思乱想
中美数图研讨班(2)·遗憾的绿宝石、教学效果评价

中美数图研讨班(3)·规划一个梦想的数字图书馆

周年盘点:图情流行缩写词一瞥(上)

    时间过得很快,忽然间写博就满一年了。注册这个博客纯粹是脑筋搭错,没想到会写到现在,也不知道哪天会因厌倦而放弃。

    博了一年,看了不少也写了不少。周年盘点总结,由一些缩写词,看图情热点所在。以下首字母缩略词八个,简称二个,共计十个,依字顺排列。

Blog:通译博客,也译作网志等,台湾译为不老阁、部落格等。全称Weblog,可算个缩写词。图林博客这一二年来越来越多,国内有钱涂无量的图林网志集大量收罗,除个人博客外,还有《大学图书馆学报》博客、厦门大学图书馆编目部blog这样的机构博客。王波在今年中国图书馆学会年会上讲“网络图书馆学的兴起与发展”,其中也少不了介绍博客。国外博客更是兴旺,著名人物有Sirsi公司副总裁、OCLC二位首席科学家,也有因博客而著名的普通馆员。一些图书馆用博客向读者提供动态内容,最近美国图书馆协会(ALA)也请图林有影响的bloggers加盟开设起技术博客。因方便随时通报信息,会议博客也大行其道,如刚开过的美国学校图书馆员协会第12届全国会议、将于11月举办的美国信息科技学会(ASIS&T)年会……等,真是一不小心就会看到一个。
参见:
岁末之博客?图林篇(http://catwizard.blogchina.com/456259.html)
图林博客之开开关关(http://catwizard.blogchina.com/462513.html)
美国版“我是博客”:Blog Person(http://catwizard.blogchina.com/959556.html)

DC:现在没人会把DC当作十进分类法(Decimal Classification )了,因为有了都柏林核心(Dublin Core)元数据。虽然不同领域的元数据众多,但已经十周年的DC在图情领域仍可称一枝独秀。随着DC与MARC各自“与时俱进”,由MARC走出的DC与MARC似乎越来越相像了
参见:
都柏林核心走向死亡?(http://catwizard.blogchina.com/208164.html)

FRBR:国际图联(IFLA)的《书目记录的功能需求》(Functional Requirements for Bibliographical Records),1998年正式出版。近年来在编目与目录(含OPAC)研究与实践领域如日中天。美国研究图书馆集团(RLG)的WEB联合目录RedLightGreen,大概是第一个全面应用的实例吧;最近OCLC的OpenWorldCat中也可看出它的应用。它的胞弟FRAR《规范记录的功能需求》(Functional Requirements for Authority Records)最近出了草案,征求意见后也将正式发布。
参见:
FRBR相关博文一堆
《规范记录的功能需求》(FRAR)新鲜出炉(http://catwizard.blogchina.com/2452640.html)

IC:越来越多的图书馆开始用智能卡作借书证、门禁卡,但这里不是指IC卡。全称Information Commons,直译为信息共享或信息共用,亦根据其形式译为信息共享空间或信息共享室;台湾译作资讯公共空间。作为图书馆阅览室的一种新形态,已有十多年历史。今年秋天,美国得克萨斯大学一所本科生图书馆差不多搬空了图书,建成了除少许工具书外没有纸本书的IC?
参见:
吴建中:开放存取环境下的信息共享空间(http://catwizard.blogchina.com/1348767.html)
Information Commons:信息共享or信息共用(http://catwizard.blogchina.com/1357492.html)

IR:不知道情报检索(Informationa Retrieval)这个术词是不是已经过时了,反正现在看到IR,那多半是指机构库或机构资料库(Institutional Repositories);台湾译为机构典藏。在图情界以外,也有译作“制度仓库”的,有些滑稽。这是OA的一种形态,由大学等研究机构设立。越来越多的人把自己公开或未公开发表的著述放到本机构的机构库中,与大家共享,因为……(见“图情流行缩写词一瞥(下)”之OA)。