为LC书目框架转换行动支招

Karen Coyle最近的长篇博文“图书馆能改变吗?”,为美国国会图书馆(LC)进行中的书目框架转换行动支招,提出可以将任务分成四块:
· Web部分(RDF、关联数据),特别提到图书馆的规范控制传统
· 书目部分(RDA、MARC21),提到(取代MARC的)数据格式,以及编目流程及界面
· 系统部分(ILS、联邦检索、开发与测试、应用纲要),即IT部分,再度表达对FRBR的质疑
· 管理部分(标准维护、转换计划),认为应先期规划,而标准也应先完成核心部分,逐步扩展
以上各块可由感兴趣的外部团队分担协作进行,以保证项目能够在LC预计的时间内完成(还有12个月)。文中提出LC可以合作的机构包括:NISO、W3C语义网社区、DCMI和最近成立语义网兴趣小组的IFLA
据文后注,ELGA2012(欧洲图书馆自动化小组)正由Lukas Koster领衔,计划一个研讨会,内容类似,也意在就新框架向LC支招。
从Karen Coyle日志行文可以看到她对取代MARC的急切心情,很有点皇帝不急急太监的意思。联想到2007年初她和Diane Hillmann的论文《RDA:20世纪的编目规则》,导致RDA在当年4月与DCMI开始协作,并形成RDA的开放元数据注册。LC这一行动是机构内部的,与原就合作进行的RDA编制在机制上并不具有可比性,但此日志的观点,或多或少影响LC书目框架转换行动的进行也未可知。
根据其日志的CC协议,全文翻译附后。由于原文有墙,图片传至本地。
Coyle’s InFormation: Can libraryies change? (March 31, 2012)
——–Karen Coyle:图书馆能改变吗?———-
LC宣布,已经到了作出延迟已久的、改用新数据格式的时候了,这撼动了图书馆界。普遍的反应是:“现在怎么可能:1)成千上万的图书馆系统主要是为MARC记录设计的,2)没钱支付大的改变,3)对应该往哪里去没有明确的想法。”这种担心在增加,因为事实上对此计划至今几乎没有公开活动的迹象。

这一改变的性质是巨大的,虽及不上欧洲转换到欧元,但在图书馆界,这一改变的量级相当于从IPv4转换到IPv6。以前我们曾做出过大变,尤其是从卡片目录改到OPAC。那要求我们购买新系统,并转换整个印刷卡片目录为MARC格式。令人惊讶地,完成这一转换只花了约十年。
然而,这有关键的差别:那次改变完全发生在图书馆界内部,而这次改变特别复杂,因为图书馆数据未来的目标环境是网络(Web)。这一新框架将需要与大量复杂的网络信息环境结合,这增加了未知(“Web用户如何与图书馆数据互动?”),但也提供了一些在改用MARC时不曾有的可能性。主要是,在设计与实施这一改变时,可以利用现有Web技术及Web社区。
对我而言,这意味着这我们正着手的不是“仅图书馆”的活动。数量不明的用户与系统想要或需要利用Web上的图书馆数据,至少我们希望如此。目前,需要书目数据的Web服务常常指向亚马逊,其他的依赖“众包”解决方案如MendeleyZotero。什么会使图书馆数据对更大范围最有用且可用?这不是我们应该问图书馆的,而应该问潜在的数据用户。
我们还有其他重要问题需要考虑:我们如何测试新框架的设计是否有良好的系统功能与效率?我们如何如何转换到新框架?我们必须采用什么样的结构,才能随时间流逝而能维持并扩展该框架?
要LC在为此工作计划的18个月内搞定所有这些似乎不大可能(现在可能只剩12个月了),因为:a)他们的重点很可理解地主要在其机构的需求,b)这一努力要成功,必须有来自图书馆界外的机构参与。那是个不可能在短时间内完成的任务。
以上并非暗示LC没有聪明而有经验的员工在做此项工作──他们有。但是,如果你们机构曾经做过大项目,你们就知道,做此项目的员工也在做很多项目开始前占据其时间的日常工作,很少能够投入100%时间到新工作。现在问题就变成:更大的社区如何在适当的工作领域,帮助LC做此项目?
我设想了一系列可以由不同兴趣的支持者(constituencies)、以某种良好协调方式并列进行的任务。主要部分如下,还需更多细节:
Web部分显而易见,尤其是W3C已经对促进图书馆数据进入语义网表示了兴趣。图书馆界也越来越多认识到,我们需要相当快速地开始建立在W3C语义网活动所开发的标准基础上。语义网界也显示出类似的认识,即图书馆数据提出了有趣的挑战。例如,图书馆数据揭示了需要规范数据的方法,目前SKOS(简单知识组织体系)还不能提供。关注语义网的邮件组中的讨论表明,我们早期以RDA定义图书馆数据的努力,有助于向关联数据创建专家提供一种思考。
书目描述部分,当然是对图书馆关键的一个。对我而言,这是LC的强项,与其图书馆界合作者一起:确定图书馆用以描述其资源并提供用户检索的数据的语义。对此RDA已经做了很多,但前面的任务是确保可以用新的数据格式表达这些概念。还应该分析编目工作流程,甚至编目界面所期望的功能。这部分提出的需求,将提示Web及IT部分,帮助LC转换这些需求到可实施的结构与应用。
IT部分绝对必须:如何确保数据结构与整个图书馆系统功能(从采访到流通)配合良好。我尤其关注一个问题,即围绕FRBR实体构建的大型书目数据库的效率。书目控制未来报告建议测试FRBR。RDA已测试了很多FRBR概念,但至今还没有证明使用FRBR实体的数据结构的概念。如我所见,本部分将包括图书馆系统厂商,以及从事“大数据”及语义网技术的某些计算机专家。
管理方面很重要,但在LC计划中可能在稍后阶段,因为主要是处理未来活动如标准的维护与修订。然而这可能是个错误,因为标准的维护与扩展必须放在新框架的初始。甚至可以说,新框架应当从核心开始开发并扩展,以此消除在开幕日就要求一个“包罗万象”的标准,以允许框架的阶段性实施。注意到RDA面临一些直接的问题,需要一个维护标准,诸如以何种方式处理开放控制词表,以与语义网标准兼容。
关键问题是这些活动之间的协调。然而,这样的职能在大型IT项目中并非异常。
在我看来,这样性质的部门(不一定完全如我在此所描述的),可以让LC减轻某些目前无疑正考虑从事的工作,加快全部设计完成的速度,并能产生比单个机构所能达到的更高质量的解决方案。逻辑上合作者包括NISO(既以其管理MARC标准的标准机构的职能,也以其关注图书馆技术领域的职能)、W3C语义网社区DCMI(致力于RDF应用纲要标准)及IFLA(现在有了一个语义网兴趣小组)。还有可能与其它项目协同,如互联网档案美国数字公共图书馆schema.orgZotero社区。需要明确的资助,这也不是个简单的任务。
我关心的是,如果我们不如此把自己组织起来,到2013年1月,完全无法接近以新框架创建书目数据的可能性。RDA将不适当的以MARC实施,并且由于这一解决方案是阻力最小的途径,创建新框架的工作将慢如爬行。如果我们不从事这项任务,多年以后我们将看到图书馆数据储藏于大多数信息搜寻者不可见的框架与筒仓中。那的确是非常不幸的。