学术报告:康奈尔大学图书馆的转型

今天在馆里听了康奈尔大学图书馆李欣副馆长的报告“全媒体时代的大学图书馆如何应对读者现实?—-浅谈欧美图书馆关注的动态以及康奈尔大学图书馆的转型”。李馆长说会留下PPT,不必记录,但听的过程中,发现PPT其实并不能涵盖报告内容,所以还是记了不少。

总的感觉,康奈尔大学图书馆不愧为世界一流大学图书馆,关注高等教育发展趋势,关注学校课程与教育模式(在线教育的扩展),关注技术发展,更重要的是关注读者需求,思考并调整图书馆运作。同时,强调图书馆间合作,特别注重社会责任(虽然她没有用这个词)。以上这些内容,并不是以大报告的形式呈现的,而是都有具体例证,并提供专业的思考(如对电子书及电子书阅读器,考虑使用协议如是否可分享等)。李馆长务实低调,关注细节并注意吸取他馆经验,如说国科图的馆际互借系统中到馆时间是以颜色标示的,很醒目,康大馆可以改进。

报告视野开阔、思考专业,虽然只短短二小时(含问答),内容却相当丰富。只是在落笔转述时,发现最成问题的是自己的文字竟然难以完整表述听后感受。大致总结三条,忽略了很多无法归纳进这三条的,与报告题目(及本博文的标题)并不一致。

1、在充分了解读者的基础上调整服务
(1)有计划地合并、缩减实体图书馆:
2010年物理馆转型为虚拟馆:读者使用电子资源;
2011年工程馆变为无馆藏图书馆:有馆员提供咨询;
2012年昆虫馆与生命科学馆合并:昆虫图像进行数字化、方便随时比对。
(2)学生图书馆运作顾问团:每月(?)一次会,晚餐一小时(匹萨),馆长带1位相关部门馆员征求读者建议,前半小时学生吃、馆长讲,后半小时学生提供建议。如了解图书馆是否需要进入Facebook,两年前的结论是不要,因为那是个放松的地方;两年后,约2/3的人认为需要,因之图书馆进入Facebook。
(3)分析读者情况:
咨询问题分类分析,调整咨询馆员工作时间:如下午1-2点间多问厕所位置,由学生助理值班;
入馆显示屏内容,有奖(U盘)调查:结果是,希望显示天气预报、新闻、学校讲座──不希望看馆内消息!
教授外借期限:原规定在有生之年可以永不归还,后来考虑到学生需求,现调整为两年。
(4)新媒体试验,不成功就放弃,投入到新的方面:
维基百科,曾在上面投入很多,后来发现经常被反复改掉,终放弃;
iTune:较成功;
Flickr:在上面的图片,会有读者留言提供背景资料,丰富了馆藏。

2、图书馆间合作
(1)馆际互借:常春藤校之间的一般48小时内可以到馆,其他学校时间较长(认为5天以上较难接受),会考虑通过亚马逊购入(价高、但到馆快)。年借入5-6万,借出7-8万。
(2)2CUL,与哥伦比亚大学深度合作:两个均在纽约州的私立大学,读者可申请对方读者证,馆藏建设分工、编目合作(互相为对方做小语种编目),甚至共同聘用一个领域的学科馆员,还在考虑只买一个图书馆集成系统。

3、社会责任方面
(1)购买电子资源:不参与保密协议,公开打折信息,让所有图书馆可以公平获取资源
(2)维护arXiv.org及VIVO:康大馆运作的世界最大理工类电子文档服务arXiv,由于太成功,年维护费已达$40万。在难以独立维护的情况下,拒绝出版商购买,而是计划用三年时间,逐步征求其他机构共同出资,继续提供服务。
(3)为弱势群体做实事──TEEAL工程:与出版商联系,制作200多种农业电子期刊全文数据库,以移动硬盘方式向无条件使用互联网国家提供,收取成本费(查了下,1993-2009为$5000,年度更新$525,可打折)。目前有300套购买。
(4)多渠道提供馆藏:参与Google图书(50万册)、微软图书(8万册)、互联网档案等[2012-4-10说明:无版权图书在网上提供公开访问]。有意思的是,微软制作的8万册无版权图书,放到亚马逊上以按需印刷(POD)方式提供,去掉格式转换等人工费,竟然还能赚回──李馆长说,这说明读者使用习惯是不同的

附记:每个人听报告的感受都是不一样的。以前听完各自散去,没有这个体会。这次听了几个同事的简评,竟然和我理解的角度完全不同,超乎想像。

我的感受是,很多时候事情不是有没有人做的问题,而首先是有没有人想到的问题。
[update 2012-4-19]本馆新闻中的报道:美国康奈尔大学图书馆副馆长来校讲座 (2012-4-13)

虚拟国际规范档移交OCLC

虚拟国际规范档(VIAF)是一个由美国国会图书馆LC、德国国家图书馆DNB和OCLC共同发起,法国国家图书馆BnF其后加入,目前有数十家机构贡献数据的名称规范服务。作为OCLC研究部的一个原型项目,一直由OCLC负责维护。4月4日的消息,VIAF现移交给OCLC,成为OCLC服务的一部分。
想到OCLC的WorldCat数据使用政策去年底令瑞典国家图书馆终止加入WorldCat谈判(2011年12月22日),不免特别关注VIAF成为OCLC服务后,会不会对其数据的使用有什么负面影响?

在OCLC研究部的新闻中(VIAF (Virtual International Authority File) Transitions from OCLC Research Prototype to OCLC Service, 4 April 2012)只是说“OCLC将继续让VIAF公开获取”。仅仅open还是不够的。
再看OCLC的新闻(Virtual International Authority File service transitions to OCLC; contributing institutions continue to shape direction through VIAF Council, 4 April 2012),看到法国国家图书馆BnF总裁说:“新协议确定VIAF数据的免费重用,包括遵守ODC-By协议的商业数据重用。”这Free才比较令人放心,应该不会阻碍未来数据的流动。

VIAF历史:
· 1998年4月,LC、DNB、OCLC开始项目
· 2003年8月6日(IFLA柏林年会期间),LC、DNB、OCLC签署协议,成立VIAF联盟(VIAF Consortium)
· 2007年10月5日,BnF加入VIAF联盟协议生效
· LC、DNB、BnF、OCLC成为联盟负责人(Principals),提供规范和书目数据的其他机构以贡献者(Contributors)身份加入联盟
· 2010年负责人开始为VIAF讨论适当的长期组织安排。在考虑了多种可能性之后,负责人和贡献者同意将VIAF移交成为一项OCLC服务。2011年移交细节经讨论后得到同意。

访问VIAF:http://viaf.org/
OCLC的VIAF页面:http://www.oclc.org/viaf/

[update 2012-4-10] 两篇博文(均在墙外──用Google Reader,无需架梯)

Coyle’s InFormation: VIAF gets serious (Apr 8, 2012)
认为接下来该是主题词表做关联数据了。提到ODC-BY协议,指出未具体说明BY的方式。

Bibliographic Wilderness: Re-usable linked big data for real (Apr 9, 2012)
欢迎开放。协议方面,关注BY。格式方面,特别希望放弃RDF,改用更简易、更适合消费的JSON。

为LC书目框架转换行动支招

Karen Coyle最近的长篇博文“图书馆能改变吗?”,为美国国会图书馆(LC)进行中的书目框架转换行动支招,提出可以将任务分成四块:
· Web部分(RDF、关联数据),特别提到图书馆的规范控制传统
· 书目部分(RDA、MARC21),提到(取代MARC的)数据格式,以及编目流程及界面
· 系统部分(ILS、联邦检索、开发与测试、应用纲要),即IT部分,再度表达对FRBR的质疑
· 管理部分(标准维护、转换计划),认为应先期规划,而标准也应先完成核心部分,逐步扩展
以上各块可由感兴趣的外部团队分担协作进行,以保证项目能够在LC预计的时间内完成(还有12个月)。文中提出LC可以合作的机构包括:NISO、W3C语义网社区、DCMI和最近成立语义网兴趣小组的IFLA
据文后注,ELGA2012(欧洲图书馆自动化小组)正由Lukas Koster领衔,计划一个研讨会,内容类似,也意在就新框架向LC支招。
从Karen Coyle日志行文可以看到她对取代MARC的急切心情,很有点皇帝不急急太监的意思。联想到2007年初她和Diane Hillmann的论文《RDA:20世纪的编目规则》,导致RDA在当年4月与DCMI开始协作,并形成RDA的开放元数据注册。LC这一行动是机构内部的,与原就合作进行的RDA编制在机制上并不具有可比性,但此日志的观点,或多或少影响LC书目框架转换行动的进行也未可知。
根据其日志的CC协议,全文翻译附后。由于原文有墙,图片传至本地。
Coyle’s InFormation: Can libraryies change? (March 31, 2012)
——–Karen Coyle:图书馆能改变吗?———-
LC宣布,已经到了作出延迟已久的、改用新数据格式的时候了,这撼动了图书馆界。普遍的反应是:“现在怎么可能:1)成千上万的图书馆系统主要是为MARC记录设计的,2)没钱支付大的改变,3)对应该往哪里去没有明确的想法。”这种担心在增加,因为事实上对此计划至今几乎没有公开活动的迹象。

这一改变的性质是巨大的,虽及不上欧洲转换到欧元,但在图书馆界,这一改变的量级相当于从IPv4转换到IPv6。以前我们曾做出过大变,尤其是从卡片目录改到OPAC。那要求我们购买新系统,并转换整个印刷卡片目录为MARC格式。令人惊讶地,完成这一转换只花了约十年。
然而,这有关键的差别:那次改变完全发生在图书馆界内部,而这次改变特别复杂,因为图书馆数据未来的目标环境是网络(Web)。这一新框架将需要与大量复杂的网络信息环境结合,这增加了未知(“Web用户如何与图书馆数据互动?”),但也提供了一些在改用MARC时不曾有的可能性。主要是,在设计与实施这一改变时,可以利用现有Web技术及Web社区。
对我而言,这意味着这我们正着手的不是“仅图书馆”的活动。数量不明的用户与系统想要或需要利用Web上的图书馆数据,至少我们希望如此。目前,需要书目数据的Web服务常常指向亚马逊,其他的依赖“众包”解决方案如MendeleyZotero。什么会使图书馆数据对更大范围最有用且可用?这不是我们应该问图书馆的,而应该问潜在的数据用户。
我们还有其他重要问题需要考虑:我们如何测试新框架的设计是否有良好的系统功能与效率?我们如何如何转换到新框架?我们必须采用什么样的结构,才能随时间流逝而能维持并扩展该框架?
要LC在为此工作计划的18个月内搞定所有这些似乎不大可能(现在可能只剩12个月了),因为:a)他们的重点很可理解地主要在其机构的需求,b)这一努力要成功,必须有来自图书馆界外的机构参与。那是个不可能在短时间内完成的任务。
以上并非暗示LC没有聪明而有经验的员工在做此项工作──他们有。但是,如果你们机构曾经做过大项目,你们就知道,做此项目的员工也在做很多项目开始前占据其时间的日常工作,很少能够投入100%时间到新工作。现在问题就变成:更大的社区如何在适当的工作领域,帮助LC做此项目?
我设想了一系列可以由不同兴趣的支持者(constituencies)、以某种良好协调方式并列进行的任务。主要部分如下,还需更多细节:
Web部分显而易见,尤其是W3C已经对促进图书馆数据进入语义网表示了兴趣。图书馆界也越来越多认识到,我们需要相当快速地开始建立在W3C语义网活动所开发的标准基础上。语义网界也显示出类似的认识,即图书馆数据提出了有趣的挑战。例如,图书馆数据揭示了需要规范数据的方法,目前SKOS(简单知识组织体系)还不能提供。关注语义网的邮件组中的讨论表明,我们早期以RDA定义图书馆数据的努力,有助于向关联数据创建专家提供一种思考。
书目描述部分,当然是对图书馆关键的一个。对我而言,这是LC的强项,与其图书馆界合作者一起:确定图书馆用以描述其资源并提供用户检索的数据的语义。对此RDA已经做了很多,但前面的任务是确保可以用新的数据格式表达这些概念。还应该分析编目工作流程,甚至编目界面所期望的功能。这部分提出的需求,将提示Web及IT部分,帮助LC转换这些需求到可实施的结构与应用。
IT部分绝对必须:如何确保数据结构与整个图书馆系统功能(从采访到流通)配合良好。我尤其关注一个问题,即围绕FRBR实体构建的大型书目数据库的效率。书目控制未来报告建议测试FRBR。RDA已测试了很多FRBR概念,但至今还没有证明使用FRBR实体的数据结构的概念。如我所见,本部分将包括图书馆系统厂商,以及从事“大数据”及语义网技术的某些计算机专家。
管理方面很重要,但在LC计划中可能在稍后阶段,因为主要是处理未来活动如标准的维护与修订。然而这可能是个错误,因为标准的维护与扩展必须放在新框架的初始。甚至可以说,新框架应当从核心开始开发并扩展,以此消除在开幕日就要求一个“包罗万象”的标准,以允许框架的阶段性实施。注意到RDA面临一些直接的问题,需要一个维护标准,诸如以何种方式处理开放控制词表,以与语义网标准兼容。
关键问题是这些活动之间的协调。然而,这样的职能在大型IT项目中并非异常。
在我看来,这样性质的部门(不一定完全如我在此所描述的),可以让LC减轻某些目前无疑正考虑从事的工作,加快全部设计完成的速度,并能产生比单个机构所能达到的更高质量的解决方案。逻辑上合作者包括NISO(既以其管理MARC标准的标准机构的职能,也以其关注图书馆技术领域的职能)、W3C语义网社区DCMI(致力于RDF应用纲要标准)及IFLA(现在有了一个语义网兴趣小组)。还有可能与其它项目协同,如互联网档案美国数字公共图书馆schema.orgZotero社区。需要明确的资助,这也不是个简单的任务。
我关心的是,如果我们不如此把自己组织起来,到2013年1月,完全无法接近以新框架创建书目数据的可能性。RDA将不适当的以MARC实施,并且由于这一解决方案是阻力最小的途径,创建新框架的工作将慢如爬行。如果我们不从事这项任务,多年以后我们将看到图书馆数据储藏于大多数信息搜寻者不可见的框架与筒仓中。那的确是非常不幸的。