OAI-ORE《对象重用与交换》笔记

《对象重用与交换》(OAI-ORE),此标准的名称说明了目的或功用,但“对象”指什么?这个“对象”,当指资源及其组合,在OAI-ORE中称为“聚合”(aggregations)。
“我们使用多页Web文档首页的URI来标识整个文档,我们使用HTML页面的URI提供访问一个Flickr集以识别整个图像集。但这些URI实际上只是识别这些特定页面,不是构成整个文档的页面联合,或者识别在一个Flickr聚合中所有图像的联合。本质上,此问题是,没有标准途径去描述聚合的成分或边界,这正是OAI-ORE致力于提供的。”——ORE User Guide – Primer

OAI-ORE目前为1.0版,用户指南文件包括入门、抽象模型、词表、序列化格式等:
Open Archives Initiative Object Reuse and Exchange (OAI-ORE) (version 1.0, 17 October 2008)

概要:
在Web中,“资源”指代感兴趣的任何项目,聚合则指资源的某种组合。
OAI-ORE基于语义网,以RDF图(三元组)描述Web资源的聚合。
OAI-ORE使用资源地图(Resource Map)描述聚合的成分或边界,揭示聚合本身及与被聚合资源间关系,并可选用代理(Proxy)指明被聚合资源。
OAI-ORE标准可用于网络爬虫、网络计量研究、数据交换与交互、数据重用与重构等,供机读使用。

ORE模型中关键实体间关系UML图

———- ORE Specification – Abstract Data Model 抽象数据模型 ———-

聚合特征
– 资源可能在一个服务器上,也可能分布在Web上;
– 资源间关系各异,如包含、替代等;
– 资源类型可能不同,甚至由不同词表定义,如书目、目次等;
– 资源与外部资源间关系各异,如引文、镜像、译文等。

聚合举例
– 相同类型、不同项目:收藏图片集,来自不同网站;多页HTML文档,以“前页”、“后页”链接;
– 相同项目、不同格式:Flickr上的照片,有多个尺寸与分辨率的图像,另有评论等;学术出版物,以过渡页(splash page)形式存储在arXiv等中,链接到多种格式全文,另有引文链接等;
– 不同类型资源组合:研究成果集,由成果、数据、可视化分析工具组成;
– 有层次的资源组合如:叠加期刊(overlay journal),文章组合为期、期组合为卷、卷组合为期刊。

5.3代理(Proxy)【这个没完全弄明白,尤其是第3个】
特定于聚合环境的关系(非全域/全局关系,即不是在所有情况下成立),必须断言两个三元组(代理P作为被聚合资源AR的代理,在聚合A中起作用):
<P> <ore:proxyFor> <AR>
<P> ore:proxyIn <A>

用途:
– 被聚合资源间关系(如:顺序关系,只适用于特定聚合中。参考文献的顺序,对各参考文献本身不适用)
<P-1> <hasNext> <P-2>
– 外部被断言关系到被聚合资源(如:引用关系。聚合是最佳论文集,用代理表明所引被聚合资源为最佳论文)
<URI-1> <xyz:cites> <P-1>
– 链接被聚合资源(如:起源或出处,被聚合资源来源于另一个资源)
<P-1> <ore:lineage> <P-2>
对主体代理的资源地图必须包含三元组 <P-1> <ore:proxyFor> <AR-1>
对客体代理的资源地图必须包含三元组 <P-2> <ore:proxyFor> <AR-1>(两个三元组中被聚合资源AR-1相同)

the use of ore:lineage

———- ORE Specification – Vocabulary 词表 ———-
指导原则是在可能的情况下重用已有词表。
使用命名空间:ore(本身), oreatom; dc, dcterms, dcmitype; foaf; owl, rdf, rdfg, rdfs

自定义类与关系
(4个)
ore:Aggregation 聚合;父类 dcmitype:Collection
ore:AggregatedResource 被聚合资源
ore:Proxy 代理(代表一个存在于特定聚合中的被聚合资源)
ore:ResourceMap 资源地图;父类 rdfg:Graph

关系/谓词(8个)
ore:aggregates 聚合;父属性 dcterms:hasPart;定义域 ore:Aggregation,值域 ore:AggregatedResource
ore:isAggregatedBy 被聚合;父属性 dcterms:isPartOf;逆属性 ore:aggregates
ore:describes 描述;定义域 ore:ResourceMap,值域 ore:Aggregation
ore:isDescribedBy 被描述;逆属性 ore:describes
ore:lineage 世系;定义域、值域 ore:Proxy
ore:proxyFor 代理;定义域 ore:Proxy,值域 ore:AggregatedResource
ore:proxyIn 代理在;定义域 ore:Proxy,值域 ore:Aggregation
ore:similarTo 相似;父属性 rdfs:seeAlso;定义域 ore:Aggregation,值域 ore:Resource

推荐的重用词表(例举而非枚举)
– 类
DCMI类型:为资源赋予大类
DCTerms:主要作为关系的定义域、值域
FOAF:用于与人相关的资源,包括个人、组织和项目

– 关系(两类关系:1、资源-关系-文字;2、资源-关系-资源)
DC元素:dc:description,dc:format(建议用MIME类型),dc:language(建议使用ISO 639-1),dc:rights,dc:title
DCTerms:dcterms:audience(建议客体dcterms:AgentClass),dcterms:contributor(建议客体dcterms:Agent),dcterms:conformsTo(建议客体dcterms:Standard),dcterms:creator(建议客体dcterms:Agent, foaf:Person),dcterms:created(ISO8601格式),dcterms:extent,dcterms:isVersionOf,dcterms:modified(ISO8601格式),dcterms:references(建议客体Resource),dcterms:replaces,dcterms:rights(建议客体dcterms:RightsStatement)
FOAF:foaf:mbox,foaf:name,foaf:page
RDF:rdf:type(建议客体rdfs:Class)
RDFS:dfs:isDefinedBy(为类规定取值词表),rdfs:label(为类规定人读标签),rdfs:seeAlso

NISO发布新计划:开发书目词表交换标准

美国国家信息标准委员会(NISO)在2012年下半年得到梅隆基金资助,计划评估新书目框架及未来需求,2014年上半年报告发布时称为“书目路标”(Bibliographic Roadmap)。针对“书目路标”中被识别为具有高优先度的领域,NISO在2014年底确定开发支持书目数据交换与互操作的标准,包括三个新项目:词表使用与复用政策、词表文档和词表保存需求(Vocabulary policies on use and reuse, Vocabulary documentation, and Vocabulary preservation requirements)。消息昨天公布:
时间表如下:
建议批准:2015年1月
任命工作组主席及第一次指导委员会会议:2015年2月
批准初始工作计划及任命工作组:2015年2月
完成初始草案标准:2015年11月
公开征求意见阶段:2015年12月
完成最后草案:2016年6月

2012年11月NISO宣布计划评估新书目框架及未来需求时,还是BIBFRAME模型发布(2012-11-21)前夜。如今BIBFRAME已经成形,处于实施前的测试阶段。NISO的新标准和BIBFRAME将是一种什么关系?

参见:
NISO Bibliographic Roadmap Development Project
ROADMAP FOR THE FUTURE OF BIBLIOGRAPHIC EXCHANGE: SUMMARY REPORT / National Information Standards Organization. APRIL 2014. ISBN: 978-1-937522-43-8. (10 p. pdf)
NISO Launches New Projects to Develop Standards for Bibliographic Vocabulary Exchange (18 Mar 2015)
A Proposed NISO Work Item: Development of Standards to Support Bibliographic Data Exchange. November 14, 2014, Last Modified: December 18, 2014. (3p. pdf)

NISO有意主导取代MARC新标准制订?(2011年11月6日)
NISO得到梅隆基金资助,评估新书目框架现状及未来需求(2012年11月9日)
2014-2-13更新:最新进展:NISO报告:通过新交换环境绘制航线:NISO书目路标行动(报告摘要于2014年4月发布)

关于资源同步框架规范(ResourceSync)

OAI (Open Archives Initiative) 致力于“开发与推进有助于内容有效传播的互操作标准。”目前的项目包括鼎鼎大名的OAI-PMH、OAI-ORE,以及最新的ResourceSync。
ResourceSync(资源同步)于2014年4月成为美国国家标准
ANSI/NISO Z39.99-2014, ResourceSync Framework Specification

ResourceSync基于网站地图协议(Sitemap protocol),为web提供一个同步框架,通过Resource List(资源清单)、Resource Dump(资源仓库=打包文件)、Change Lists(变化清单)或Change Dumps(变化仓库)方式,使得第三方系统(或者镜像)可以与服务器不断变化的内容保持同步(增加、更新、删除)。

目前可以查到的中文资料很少,汇总如下:

国家标准文献共享服务平台工作简报 2014年6月 第3期 国外标准化动态(p.20)
美国国家信息标准组织(NISO)和开放档案计划(OAI)发布美国国家标准ResourceSync框架规范——为网络服务器自动资源同步提供方法
(全文pdf 114MB,龟速下载,全文待补[update 2015-1-29 附后])

编目精灵:从NISO工作组看当前技术热点(2013年4月26日)
介绍“Working Group Connection”2013年4月号,NISO三个委员会之一Discovery to Delivery Topic Committee(发现到传递专题委员会)工作之一:
ResourceSync Working Group 资源同步工作组:研究、开发、原型、测试与布署大规模Web资源同步,意在同步对象本身,不仅仅是其元数据,建立在OAI-PMH策略上。核心小组得到斯隆基金资助,也得到包括其他产业及研究伙伴(部分受JISC赞助)的助力;年初发布公示了beta版规范,希望5月底完成最终规范供投票批准;实施规范包括Python和Jave代码库,以及DSpace专用Java实施,正进行中,马上会提供

梁娜, 张晓林. 机构知识库的互操作需求和互操作规范框架. 现代图书情报技术, 2013, 29(9): 1-7
“OAI联盟还提出OAI-RSF[41], 通过Resource List、Change List、Resource Dump和Change Dump的交换来支持不同IR间的内容动态更新。”
[41] Open Archives Initiative-ResourceSync Framework Specification – Beta Draft[EB/OL]. (2013-08-09) . [2013-08-20]. http://www.openarchives.org/rs/0.9.1/resourcesync.

———-国家标准文献共享服务平台工作简报(2014年6月 第3期,p.20-21)———-
美国国家信息标准组织(NISO)和开放档案计划(OAI)发布美国国家标准ResourceSync框架规范——为网络服务器自动资源同步提供方法

美国国家信息标准组织(NISO)和开放档案计划(OAI)宜布出版ResourceSync框架规范(ANSI/NISO Z39.99-2014)——一个新的用于网上详细介绍一台报务器可以执行允许第三方系统,保持其不断发展的资源同步各种功能的美国国家标准。该ResourceSync联合项目由Alfred P. Sloan Foundation和Jisc支持资助,开始制定有关网络资源实时同步的一个新的开放标准。
“越来越多的大型数字馆藏可从多个虚拟主机的位置提供服务,会被缓存在多台服务器上,并通过几个服务系统被利用,”Los Alamos国家实验室科学家、OAI执行总监、以及ResourceSync工作组联席主席Herbert Van de Sompel解释说。“由于网络资源的不断变化,这种内容激增导致利用一个及时和准确的方式,进行不断内容同步的服务器保持服务成为具有挑战性的问题。我们通过两年合作努力制定了该现范,它可以用来满足各种各样使用案例的挑战,通过制定标准规范和已被广泛采用的协议间对接使之变为可能。”
“该OAI协议的元数据收割(PMH)2.0规范,可以用来有效地同步资源的元数据,”康奈尔大学IT应用开发主管Simeon Warner说道,“但同步资源本身从未被指定。虽然有些资源同步方式存在,它们通常是临时性的,涉及个别的安排,并不能得到普遍部署。该新规范填补了这一空白。”
“该ResourceSync规范引入了一系列于实现的功能,一个服务器可能支持启用远程系统与其不断发展的资源保持更紧密的一致,”Old Dominion大学计算机系副教授Michael L. Nelson解释道,“这也描述了一台服务器如何展示它支持的功能。远程系统可以检查这些信息,用以确定如何最好地与不断发展的数据保持一致。所有功能都通过Sitemap协议引入的文件格式基础上得以实现。功能可以被组合用以实现不同的功能级别,从而满足不同地方或社区的需要。”
“我们期待这个新标准将通过同步和更新过程的自动化为知证库管理者节省大量的时间、精力和资源,”NISO执行董事Todd Carpenter说。“最终的结果将是提升网络知识库中内容的普遍可用性和减少由于过时、不准确、以及今天在互联网上存在被替代的内容而产生的各种问题。”
信息源:http://www.niso.org/news/pr/view?item_key=6b81b2cd3a1891acd38682a006772dfa7ecec2ab
(潘薇编辑)

[原标题:NISO and OAI Publish American National Standard on ResourceSync Framework Specification : Provides methods for web servers to automate the synchronization of resources]