MARC之后的三个方案及其优缺点

ALA技术源前些天也刚举办了一个关联数据研讨班,Karen Coyle主讲:
Libraries and Linked Data: Looking to the Future
图书馆与关联数据:展望未来

PPT共3个,已由ALA TechSource发到slideshare(可恶的是slideshare近日竟然也被墙):

1. One short intro to linked data
关联数据简介
2. After MARC: Options, New bibliographic framework
MARC之后的选项,新书目框架
3. Tools for LLD: vocabularies, linking, and application programming
图书馆关联数据工具:取值词表、链接及应用

———-MARC之后的选项———-
这部分是重点,总结MARC之后的三个方案,并分析各自的优缺点。
由RDA的三个实施方案(scenarios,p.4-7,扁平无链接、书目和规范链接、关系/面向对象),引入Karen的新书目框架三个方案(序列化、抽取、原生,p.8)。

方案3、序列化(Serialize, p.9-21):直接把MARC转为RDF格式
优点:机械的;不改变数据;无需改变系统
缺点:不改变数据;图书馆数据留在图书馆孤岛中;不链接到图书馆外部数据

方案2、抽取(Extract, p.22-37):从MARC记录库中抽取数据
举已发布为关联数据的三个例子:不列颠图书馆(BL,p.25-29),西班牙国家图书馆(BNE,p.30-35),OCLC(p.36)。
优点:无需改变图书馆系统;可在了解更多后重复抽取;编目员不可见
缺点:编目员不可见,因此没有人工质量控制(QC);关键标识不是基元数据的一部分;受当前记录内容限制
[不知道为什么我的Chrome浏览器在BNE网站看不到可视化展示]

方案1、原生(go native, p.38-39)
(1)things,元素和值都有URI
(2)存储things和关系的数据设计
(3)创建界面对创建者隐藏这些,但保持数据完整
优点:与Web资源互操作;与RDA的目的互通;图书馆目录有更丰富的可能,用户无需在图书馆和Web间选择信息源
缺点:需要替换图书馆系统;难于论证成本/效益
[目前LC的书目框架转换行动显然属于方案1──参见:LC正式启动以关联数据取代MARC (2012年5月26日)]

———-Links for Linked Data———-
PPT中涉及的链接,在Karen自己的网站上分门别类列出,很好的参考源。包括:
关联数据──概述
书目元数据元素(非图书馆)
其他元数据元素
图书馆关联数据
·图书馆标准数据集 Library Standard Data Elements
RDA Vocabularies and Elements
FRBR (FRBRer)
ISBD
FRAD
MADS in RDF
[很抱歉自己在上图关联数据会议上遗漏了最后那个──幸亏unconference时远洋师在回答国图MM关于发布规范档的关联数据问题时,做了推荐]
·取值词表
·图书馆和其他书目数据集
·开放元数据注册 Open Metadata Registry
软件和工具
关联数据组织与活动
关联数据实例
·数据库(开放图书馆、Freebase)
·样本数据(DCMI/RDA工作组的RDA使用案例:Cataloger Scenarios)[update 2015-8-26链接改为:http://wiki.dublincore.org/index.php/Cataloger_Scenarios,已没有龟标及RDF/XML格式的RDF表达]
提供10种场景,帮助编目员了解如何使用RDA取值词表、处理FRBR关系。链接到场景元数据的RDF表达,有龟标格式和RDF/XML格式。
·开放图书馆 Open Library
·开放研究在线 Open Research Online
·虚拟国际规范档 VIAF
·DBPedia
·Freebase
推荐阅读

[update 2012-7-24] Karen本人的博文
Coyle’s InFormation: Futures and Options(有墙)