书目框架模型草案发布

期待已久的美国国会图书馆“书目框架转换行动”报告《书目框架作为数据网络:关联数据模型和支持服务》发布,介绍了将要取代MARC的新模型草案。nalsi第一时间在微博上发布消息,又发了介绍博文:美国国会图书馆“书目框架转换行动”的新报告:《书目框架作为数据网络》(2012-11-25)

Bibliographic Framework as a Web of Data: Linked Data Model and Supporting Services / Library of Congress. Washington, DC, November 21, 2012(pdf, 42页)

新模型被称为BIBFRAME(书目框架的简称),据称不仅用于取代MARC,也是未来网络化世界中书目描述的基础(p.3)[或者说,不仅用于图书馆界]。三个目标:
1、清晰区分概念内容及其物理表现(如,作品和实例)
2、专注于明白识别信息实体(如,规范)
3、平衡与揭示实体间关系

BIBFRAME模型由4个主要类(class)组成(p.8):
创作作品(Creative Work):反映编目单件概念实质的资源
实例(Instance):反映作品的个体资料体现的资源
规范(Authority):反映定义作品和实例中关系的关键规范概念的资源,如人、地点、论题、组织等。
注释(Annotation):以附加信息装饰其他BIBFRAME资源的资源。如馆藏信息、封面、评论等。
──显然,在这个模型中,没有了FRBR的“内容表达”。nalsi称“这是一个简化版的FRBR模型”,我的留言:“FRBR的内容表达确实比较难界定,索性取消掉,倒也简单。可以用其他分面(语种、媒介类型等)对作品及其显示进行细分。”
──对类的具体说明,显示其“草案”状态:
反映作品关系,举例为“整体/部分”关系(p.10):显然还有待充分扩展;
每个BIBFRAME实体为一个且仅一个BIBFRAME作品的实例(p.10):难道不存在合订的情况?

报告中说明BIBFRAME模型的图1和图2,在9月份的一个介绍PPT中曾出现过:
Bibliographic Framework Initiative: Approach for MARC Data as Linked Data / Sally McCallum, Library of Congress
[update 2012-11-27] PPT中已经介绍了4个核心类,作为阶段1(phase 1),早期实验(10-11月)作为阶段1.5,阶段2为细化模型。

作为一个解决方案,BIBFRAME将有自己的词表(BIBFRAME Vocabulary, p.15)和命名空间(http://loc.gov/bibframe/vocab)表示方式(Serializing, p.16),支持工具(p.21)。
BIBFRAME词表尚未发布。从BIBFRAME和RDA-L两个邮件组中就此报告的讨论可以想像,由于其与作为RDA基础的FRBR的差异,其词表必然与RDA有某种程度的差异,或许一场风暴难以避免。

参见相关博文:书目框架

[update 2012-12-1] 官方消息:News and Announcements (November 23, 2012)
Bibliographic Framework as a Web of Data: Linked Data Model and Supporting Services (November 21, 2012)

LC正式启动以关联数据取代MARC

5月22日,美国国会图书馆(LC)宣布其“书目框架转变行动”启动建立模型工作,远洋师在书社会中及时通报。因为当时自己正好在做一件事不想中断,就没有跟进这个消息。昨天把积了几天的RSS订阅过了一遍,发现很奇怪的一个现象,尽管消息在ILFA-L和RDA邮件组中都发了,但国外博客中极少提及(甚至编目相关信息最多的catalogablog都没有),而对此事的评论也未见。书社会中雨师最早发博文,其评论担心新模型会变成另一种MARC。

下面是LC新闻稿的翻译:
The Library of Congress Announces Modeling Initiative (May 22, 2012)

LC很高兴地宣布,已经与Zepheira签约,帮助加速“书目框架行动”的启动。项目的主要工作是把MARC21格式翻译到关联数据模型,同时尽可能保留传统格式健壮且有利的方面。Zepheira给项目带来图书馆应用关联数据技术的广泛经验。
Zepheira团队由Eric Miller领导,他是早期W3C语义网行动的领导者,也曾在图书馆情报学界工作。公司在Miller先生领导下,活跃于“语义网和图书馆”标准的开发,以及支持关联数据技术与图书馆应用的开源工具方面。这些活动所体现的知识与经验,有助于构建核心数据模型,并支持作为新书目框架和相关服务基础的原型服务。
LC已要求Zepheira提出作为有力起点的模型供讨论,并对有助于本工作的、目前正进行的[其他]相关行动作出分析。LC期望,基于图书馆界有价值的反馈,以及所表达需求的自然进展,将改变或进一步调整提出的模型。最初的模型将作为演示系统/服务的工作基础,反过来也会用于进一步细化模型。期望这样的迭代反馈循环终将确保一个灵活的书目框架,一个健壮的参照规则,一个支持布署的基础架构,以及一个有效的升级计划,支持图书馆界从MARC转换到新框架。
LC现在将开始组织不同的方案,以使图书馆参与者更为广泛,并包括国际用户和合作者、不同类型信息机构和图书馆,以及图书馆供应商。我们将在书目框架转变行动网站(Bibliographic Framework Transition Initiative website)上随工作进展发布信息,特别是涉及重要事件时。
LC打算提出该行动的计划,在加州Anaheim的ALA年会上讨论并由图书馆界提供意见。Eirc Miller在这一更新时期将加入LC。(LC书目框架转换更新论坛,6月22日星期日,10:30 am-12:00,Anaheim Marriott Grand Salon A-C.)。

———-相关背景———-
关于Eric Miller其人:
The Digital Shift: Library of Congress Announces Modeling Initiative (May 24, 2012) By Matt Enis
LJ技术副主编、Matt Enis在The Digital Shift博客上介绍说,Eric Miller现任Zepheira公司总裁,曾是OCLC高级研究科学家、DCMI联合创始人(难怪上图那帮人跟他那么熟)。
Keven在书社会雨师日志下评论说Eric Miller是DC的发明人、RDF的起草人、W3C 语义小组的前负责人。

关于Zepheira公司:
Metadata Discussion Group: Library of Congress and Linked Data (May 23, 2012) by Jennifer Liss
印第安那大学图书馆的元数据讨论组博客介绍说,去年LC与Zepheira合作制作了Viewshare网站,为数字遗产馆藏提供一个平台,展示其时间线、标签云、交互地图有其他Web产品。
Viewshare网站以前远洋师好象也介绍过,也曾前往一观。

———关于LC的书目框架转换行动———-
准备抛弃MARC?美国国会图书馆启动“书目框架转变行动”(2011年5月24日)

国会图书馆书目框架计划总体规划 (2011年11月2日)

LC书目框架转换行动:首届更新论坛 (2012年2月7日)
即将在ALA年会上举办的应该是第二届吧

———相关评论———-
rainzen的书社会日志: 评国会图书馆的声明 (2012-05-23)

Nalsi的西文编目笔记III:【翻译】国会图书馆可能开始放弃MARC (五月 28th, 2011)
原文:Library of Congress May Begin Transitioning Away from MARC / Michael Kelley. LibraryJournal, May 26, 2011。作者提到“受到RDA的驱动”。

书蠹精:国际编目领域的重大新闻:美国国会图书馆可能放弃MARC格式 (2011-05-27)

“书目框架转变行动”引来一片赞扬 (2011年5月25日)

为LC书目框架转换行动支招

Karen Coyle最近的长篇博文“图书馆能改变吗?”,为美国国会图书馆(LC)进行中的书目框架转换行动支招,提出可以将任务分成四块:
· Web部分(RDF、关联数据),特别提到图书馆的规范控制传统
· 书目部分(RDA、MARC21),提到(取代MARC的)数据格式,以及编目流程及界面
· 系统部分(ILS、联邦检索、开发与测试、应用纲要),即IT部分,再度表达对FRBR的质疑
· 管理部分(标准维护、转换计划),认为应先期规划,而标准也应先完成核心部分,逐步扩展
以上各块可由感兴趣的外部团队分担协作进行,以保证项目能够在LC预计的时间内完成(还有12个月)。文中提出LC可以合作的机构包括:NISO、W3C语义网社区、DCMI和最近成立语义网兴趣小组的IFLA
据文后注,ELGA2012(欧洲图书馆自动化小组)正由Lukas Koster领衔,计划一个研讨会,内容类似,也意在就新框架向LC支招。
从Karen Coyle日志行文可以看到她对取代MARC的急切心情,很有点皇帝不急急太监的意思。联想到2007年初她和Diane Hillmann的论文《RDA:20世纪的编目规则》,导致RDA在当年4月与DCMI开始协作,并形成RDA的开放元数据注册。LC这一行动是机构内部的,与原就合作进行的RDA编制在机制上并不具有可比性,但此日志的观点,或多或少影响LC书目框架转换行动的进行也未可知。
根据其日志的CC协议,全文翻译附后。由于原文有墙,图片传至本地。
Coyle’s InFormation: Can libraryies change? (March 31, 2012)
——–Karen Coyle:图书馆能改变吗?———-
LC宣布,已经到了作出延迟已久的、改用新数据格式的时候了,这撼动了图书馆界。普遍的反应是:“现在怎么可能:1)成千上万的图书馆系统主要是为MARC记录设计的,2)没钱支付大的改变,3)对应该往哪里去没有明确的想法。”这种担心在增加,因为事实上对此计划至今几乎没有公开活动的迹象。

这一改变的性质是巨大的,虽及不上欧洲转换到欧元,但在图书馆界,这一改变的量级相当于从IPv4转换到IPv6。以前我们曾做出过大变,尤其是从卡片目录改到OPAC。那要求我们购买新系统,并转换整个印刷卡片目录为MARC格式。令人惊讶地,完成这一转换只花了约十年。
然而,这有关键的差别:那次改变完全发生在图书馆界内部,而这次改变特别复杂,因为图书馆数据未来的目标环境是网络(Web)。这一新框架将需要与大量复杂的网络信息环境结合,这增加了未知(“Web用户如何与图书馆数据互动?”),但也提供了一些在改用MARC时不曾有的可能性。主要是,在设计与实施这一改变时,可以利用现有Web技术及Web社区。
对我而言,这意味着这我们正着手的不是“仅图书馆”的活动。数量不明的用户与系统想要或需要利用Web上的图书馆数据,至少我们希望如此。目前,需要书目数据的Web服务常常指向亚马逊,其他的依赖“众包”解决方案如MendeleyZotero。什么会使图书馆数据对更大范围最有用且可用?这不是我们应该问图书馆的,而应该问潜在的数据用户。
我们还有其他重要问题需要考虑:我们如何测试新框架的设计是否有良好的系统功能与效率?我们如何如何转换到新框架?我们必须采用什么样的结构,才能随时间流逝而能维持并扩展该框架?
要LC在为此工作计划的18个月内搞定所有这些似乎不大可能(现在可能只剩12个月了),因为:a)他们的重点很可理解地主要在其机构的需求,b)这一努力要成功,必须有来自图书馆界外的机构参与。那是个不可能在短时间内完成的任务。
以上并非暗示LC没有聪明而有经验的员工在做此项工作──他们有。但是,如果你们机构曾经做过大项目,你们就知道,做此项目的员工也在做很多项目开始前占据其时间的日常工作,很少能够投入100%时间到新工作。现在问题就变成:更大的社区如何在适当的工作领域,帮助LC做此项目?
我设想了一系列可以由不同兴趣的支持者(constituencies)、以某种良好协调方式并列进行的任务。主要部分如下,还需更多细节:
Web部分显而易见,尤其是W3C已经对促进图书馆数据进入语义网表示了兴趣。图书馆界也越来越多认识到,我们需要相当快速地开始建立在W3C语义网活动所开发的标准基础上。语义网界也显示出类似的认识,即图书馆数据提出了有趣的挑战。例如,图书馆数据揭示了需要规范数据的方法,目前SKOS(简单知识组织体系)还不能提供。关注语义网的邮件组中的讨论表明,我们早期以RDA定义图书馆数据的努力,有助于向关联数据创建专家提供一种思考。
书目描述部分,当然是对图书馆关键的一个。对我而言,这是LC的强项,与其图书馆界合作者一起:确定图书馆用以描述其资源并提供用户检索的数据的语义。对此RDA已经做了很多,但前面的任务是确保可以用新的数据格式表达这些概念。还应该分析编目工作流程,甚至编目界面所期望的功能。这部分提出的需求,将提示Web及IT部分,帮助LC转换这些需求到可实施的结构与应用。
IT部分绝对必须:如何确保数据结构与整个图书馆系统功能(从采访到流通)配合良好。我尤其关注一个问题,即围绕FRBR实体构建的大型书目数据库的效率。书目控制未来报告建议测试FRBR。RDA已测试了很多FRBR概念,但至今还没有证明使用FRBR实体的数据结构的概念。如我所见,本部分将包括图书馆系统厂商,以及从事“大数据”及语义网技术的某些计算机专家。
管理方面很重要,但在LC计划中可能在稍后阶段,因为主要是处理未来活动如标准的维护与修订。然而这可能是个错误,因为标准的维护与扩展必须放在新框架的初始。甚至可以说,新框架应当从核心开始开发并扩展,以此消除在开幕日就要求一个“包罗万象”的标准,以允许框架的阶段性实施。注意到RDA面临一些直接的问题,需要一个维护标准,诸如以何种方式处理开放控制词表,以与语义网标准兼容。
关键问题是这些活动之间的协调。然而,这样的职能在大型IT项目中并非异常。
在我看来,这样性质的部门(不一定完全如我在此所描述的),可以让LC减轻某些目前无疑正考虑从事的工作,加快全部设计完成的速度,并能产生比单个机构所能达到的更高质量的解决方案。逻辑上合作者包括NISO(既以其管理MARC标准的标准机构的职能,也以其关注图书馆技术领域的职能)、W3C语义网社区DCMI(致力于RDF应用纲要标准)及IFLA(现在有了一个语义网兴趣小组)。还有可能与其它项目协同,如互联网档案美国数字公共图书馆schema.orgZotero社区。需要明确的资助,这也不是个简单的任务。
我关心的是,如果我们不如此把自己组织起来,到2013年1月,完全无法接近以新框架创建书目数据的可能性。RDA将不适当的以MARC实施,并且由于这一解决方案是阻力最小的途径,创建新框架的工作将慢如爬行。如果我们不从事这项任务,多年以后我们将看到图书馆数据储藏于大多数信息搜寻者不可见的框架与筒仓中。那的确是非常不幸的。