[ZT]用于电子书的RSS——OPDS

在书社会上看到Jada写的这篇日志,觉得值得钻研一番。现征得Jada许可,转贴于此。

依Jada指点在Stanza的“共享”中增加了几个资源,从PragPub Magazine中下载了一期杂志,从云中书城下载了一个漫画,才知道一直以为面目可憎的ePub电子书其实也可以有图片并编出漂亮的版式。不过在吾国,添加了Internet Archive也无法连上,可惜了那上面数以百万计的电子书。

查了下,该标准由Internet Archive等制订,正是Google图书的竞争对手。

Open Publication Distribution System

用于电子书的RSS——OPDS / by Jada

开放出版发行系统OPDS(Open Publication Distribution System),是一种用于电子书书目信息发布和订阅的格式标准,基于atom。它的功能类似于博客订阅中的RSS格式标准,只不过是专为电子书而设计的。这个标准以epub格式的电子书为主要格式,也叫OpenPub。2010年5月推出0.9,最新的是今年6月推出的1.1版本。

该标准的一大好处是支持各种桌面和移动终端,各种软件,可以让电子书书目信息在不同的终端和电子书阅读软件上显示和分享。读者可以用一款阅读器软件,订阅多个来源电子书书目信息,像RSS订阅一样,实时更新。目前已有著名的Stanza软件支持OPDS。IPAD中文版的Stanza在app store上有下载。对一些不涉及版权等问题的免费电子书,可直接下载到本机阅读,十分方便。

该标准也提供对书籍借阅方面的支持,如订阅电子书目后,除了浏览书目信息,还可以连接到书目信息提供者,如果是图书馆,可直接借阅。该标准定义了以下可能的情境:
http://opds-spec.org/acquisition
http://opds-spec.org/acquisition/open-access
http://opds-spec.org/acquisition/borrow
http://opds-spec.org/acquisition/buy
http://opds-spec.org/acquisition/sample
http://opds-spec.org/acquisition/subscribe

这些情景就包括借阅和购买。以下是编码范例:

<link rel=”http://opds-spec.org/acquisition” href=”/content/free/4561.epub” type=”application/epub+zip”/>
<link rel=”http://opds-spec.org/acquisition” href=”/content/free/4561.mobi” type=”application/x-mobipocket-ebook”/>
<link rel=”http://opds-spec.org/acquisition/buy” href=”/content/4561.pdf” type=”application/pdf”>
<opds:price currencycode=”USD”>18.99</opds:price>
<opds:price currencycode=”GBP”>11.99</opds:price>
</link>

其中rel 代表这本书来源的状况,而href 则是连结位置,type 则是文档的状态,可以用在让电子书阅读器选择所支持的格式,如:application/epub+zip ,application/pdf ,application/x-mobipocket-ebook。
rel=”http://opds-spec.org/acquisition/buy” 说明这本书是需要购买的,<opds:price currencycode=”USD”>18.99</opds:price>是对书籍价格的描述。关于书的元数据的显示,封面的显示,分页显示等等,也有定义。

OPDS的另一个亮点是支持按主题、日期、流行度等分面浏览。包括以下定义:
http://opds-spec.org/sort/new
http://opds-spec.org/sort/popular
http://opds-spec.org/featured
http://opds-spec.org/crawlable
http: //opds-spec.org/shelf
http://opds-spec.org/subscriptions

目前提供OPDS订阅的在线资源有

Feedbooks: http://www.feedbooks.com/catalog.atom
Internet Archive: http://bookserver.archive.org/catalog/
PragPub Magazine | The Pragmatic Bookshelf: http://pragprog.com/magazines.opds
Revues.org: http://bookserver.revues.org/
Project Gutenberg: http://m.gutenberg.org
Ebooks libres et gratuits: http://www.ebooksgratuits.com/opds/
Legimi – digital content delivery platform: http://www.legimi.com/opds/root.atom
Shucang: http://www.shucang.com/s/index.php
Plough Publishing: http://www.plough.com/ploughCatalog_opds.xml
SNDA YZSC: http://opds.yzsc.com.cn

支持OPDS的软件有

Infinite Book Reader: – eBook reader for the iPad.
QuickReader: – The Speed Reading eBook Reader for the iPad, iPhone, and iPod Touch.
Aldiko: – EPUB reader and OPDS client for Android
EPUBReader: – All devices and OS supporting Firefox and SeaMonkey Web Browsers
FBReader: – All devices with network access.
Ouiivo Reader: – EPUB reader and OPDS client for iPhone and iPod Touch
MegaReader: – Highly customizable eBook reader for the iPad, iPhone, and iPod Touch with Heads Up Display.
Cool Reader: – Only in Android version.
eBook Search: – Allows you to download free books from OPDS catalogs to iBooks, Kindle, Nook or your favorite iOS eBook reader app. Download for free from iTunes app store.
Mantano Reader'”: ePub and PDF reader for Android.

OPDS生成工具
Lucicat 在服务器上生成OPDS书目信息。 基于 PHP/MySQL。

http://lucidor.org/lucicat/

对于图书馆来说,可以利用这个标准,在电子书内容整合上,大有可为啊。

斯坦福关联数据研讨会报告

斯坦福关联数据研讨会于2011.6.27-7.1召开,会议主办者为图书馆信息资源委员会(Council on Library and Information Resources, CLIR)与斯坦福大学图书馆与学术信息资源中心(Stanford University Libraries and Academic Information Resources, SULAIR)。不禁联想到当年MARC开发也有CLIR(当时称CLR)的很大功劳。
会议报告于日前发布(报告下载),长达80页,有点不可思议,这是真正有所行动的会议。

———-引言(p.5-6)———-
概述会议背景及本报告内容:
·详述会议成果
·列出下步活动,包括为关联数据原型环境提出建议
·与会者小传
·概述会议期间的活动与讨论

———-W3C图书馆关联数据孵化小组最终报告(p.7-17)———-
引用W3C图书馆关联数据孵化小组最终报告,虽称引用的是草案,但网址是正式报告的。或许本报告的发布也是在等孵化小组最终报告正式发布吧(10月25日)。
据说孵化小组报告马上会有中文翻译([update 2011-11-14]图林中文译站:图书馆关联数据孵化小组最终报告/2011年10月25日W3C孵化小组起草;译者:娄秀明),此处略去,仅取一个定义:
· 图书馆数据:指图书馆生产或保管的、任何描述资源或助其被发现的数字信息。图书馆隐私政策范围内的数据通常不在此列。本报告基于其典型使用,划分作三类:数据集、元素集和取值词表。

———-经典MARC数据与关联数据方法比较(p.18-19)———-
详细介绍Tim Hodson的“大英图书馆数据模型”(British Library Data Model: Overview, 2011-7-22)(PDF版模型图),称其对现实关联数据模型的处理在图书馆环境中扩展了W3C关联数据的文本定义。

———-研讨会成果(p.20-42)———-
· 价值声明:为什么关联数据方法是有价值的原型/模型

· 关联图书馆(及博物馆、档案馆……)宣言(manifesto)
1. 为发现与使用而非暗中保存而在网上发布数据,不可及的档案通常是私有的或利益驱动的。
2. 持续改进数据与关联数据,而非等待发布“完美”数据
3. 以语义结构化数据,而不预备扁平的非结构化数据
4. 协作而不单干
5. 采用Web标准,而非领域独有的标准
6. 使用开放、广为所知的协议,而非封闭/本地协议

· 为图书馆催生关联数据环境 [实践]
1. 构建使用案例
2. 摄入数据(由开放存储中使用结构化数据,构建或转码关联数据,同时实施质量控制)
3. 发布数据,假定为开放的以让其他人可用
4. 提供基于使用案例的结构化数据的服务
5. 重复步骤1-5[4?],增加或更新使用案例,得到新的相关数据,改善数据、改进服务
6. 教育元数据生产者(如出版者、馆员、学术项目领导者),向最终用户推广服务

· 已知问题优先清单
问题涉及四个类别:出处、可用性、保存、标准
1. 跨格式参照、同指与一致(referencing, co-referencing, reconciliation)(标准)
[owl:sameAs;词表alignment]
2. 使用图书馆规范档-名称、主题等(标准、可用性)
3. 杀手级应用(可用性)
MIT、BBC野生动物网站、Talis的LinkSailor及Civil War 150网站
4. 归属、来源及授权(出处)
5. 培训创建、衍生与发布URI,以及在发现环境中做链接、用链接(可用性)
6. 数据可用性(可用性)
7. 质量控制(可用性)
8. URI标准(标准)
9. 数据保管(保存)
10. 责任分担(可用性)
a. 数据保存(即9)
b. 反馈、报告、奖励制度、计量、贡献关联数据/URI的激励
c. 博弈与竞争(即11)
11. 营销/拓展(可用性)
12. 流程(可用性)
13. 可扩展性
14. 索引
15. 本体使用(标准)
16. 许可(标准)
17. 注释(出处)
18. 身份管理
19. 与e-学术(尤其是e-科学)及e-学习的关系
20. 文化多样性(可用性)
21. 搜索引擎优化(标准)
微数据,Google的schema.org [仅仅是搜索引擎优化,没有竞争关系?]
22. 社会媒体:Facebook及类似应用
Facebook的开放图形协议

———-布署关联数据(见附录A)———-

———-搜索杀手级应用(p.43-44)———-

———-下一步及潜在计划(p.45-48)———-
· 下一步
斯坦福团队将在其他参与者帮助下,生成一个建立在关联开放数据上的多国、多机构发现环境模型,向最终用户、研究界证明关联数据方法的价值。该模型必然会的基本功能包括生成、收割、URI调和[reconcile?],以及改编或有必要建立一个或多个“杀手级应用”,组装/要求支持流程的必要步骤,以及学术信息资源的操作环境。该模型将与本次与会者及其他共享。

· 明确的建议
∠ URI创建
由学术期刊文章元数据创建结构化数据URI,斯坦福HighWire出版社与大英图书馆(BL)潜在联合计划。目标元数据来自:HighWire服务器的文章(6.7M)、Medline/PubMed的元数据(>21M引文)、大英图书馆得到许可使用的2万种期刊的文章。
∠ MARC记录
斯坦福团队将与与会的国家图书馆(LC、BL、BnF、DNB)等一同工作。受2011年9月欧洲国家图书馆会议(CENL)大胆声明、投票支持将其元数据开放为关联开放数据的鼓舞,我们将追随BL协同Talis所做优良工作──设计一个丰富的、理解网络的图书馆关联数据的数据模型,通过由MARC记录出取适当事实构建其关联数据,将数据发布为开放数据而不限制其使用。
我们的计划也包括关注支撑当今图书馆元数据的不同类型的规范记录。
∠ 开放VIAF
高度期望创建一个“开放的”VIAF,或者要求OCLC以开放关联数据服务提供VIAF。
∠ 手稿互操作
斯坦福将以URI收集手稿描述(著录)。随后可由斯坦福或其他机构连接展示不同中世界手稿集的个别应用。
∠ 关联开放数据工具套件
已知工具太一般不适合图书馆需要,出版者则需要另外的工具。
目标不是罗列所有已有工具,而是引进经试用与测试的工具与方法,向没有关联数据经验的机构提供。
∠ MARC交换所
应当由URI建立MARC交换所(数据存储),应当包括资源的FRBR第一组实体关系即WEMI。

· 其他潜在计划
特定领域计划
关联数据能力构造

———-读物与报告———-

———-相关工具(p.49-50)———-
· eXtensible Catalog
· BnF发布了其关联开放数据计划的初版http://data.bnf.fr。该计划应用FRBR原则,包括主要法语作家与作品的简单Web页,其HTML完全开放给Web。
实例 [虽不懂法语,但也看得出相当好]
· LUCERO Project
· Talis的LOD Around The Clock (LATC)

———-结论(p.50-51)———-

———-附录———-
· 附录A:RDF三元组创建与迭代和解(?Iterative Reconciliation)的样本流程(p.52-55)
[原则] 1. 早发布,常发布;2. 完美URI (Mint URIs);3. 链接留到以后
· 附录B:文化遗产机构相关的关联与开放数据(p.56-60)
[目前提供关联或开放数据的机构,长长的清单,可供按图索骥]
· 附录C:参与者(p.61-73)
[国际会议──看到德国、法国、芬兰、日本……,也有图书馆界外如Google参与。部分人未实际与会]
· 附录D:研讨会日程概要(p.74-80)

via Local Weather: Report of the Stanford Linked Data Workshop, 27 June – 1 July 2011 (published October 2011)(梯子自备)

2011数字保存峰会

2011年10月19-20日,2011数字保存峰会在德国举行,欧美15个国家约100位国际专家参加。面对信息完全以数字格式而非印刷存在的比例迅速增加的现状,如何确保这些数字资料长期保存不变且可访问?谁为此承担责任?这是本次峰会“准备好数字保存”的议题。
会议由Goportis即莱布尼兹研究信息图书馆网络主办,该机构由德国三个国家图书馆组成,即德国国家科技图书馆(TIB,汉诺威)、德国国家医学图书馆(ZB MED,波恩/科隆)和德国国家经济图书馆-莱布尼磁经济信息中心(ZBW,基尔/汉堡)。在德国,Goportis是支持电子与印刷全文文献、许可、非文本资料、数字保存及开放存取的专业伙伴。Goportis致力于集成该领域知识,开始进一步发展。
据ZBW主任Klaus Tochtermann教授在开幕式上称,“到2020年,80%学术出版物将仅以数字格式出现而无印刷格式”。
但是,数字保存不只处理科学信息的保存。例如,葡萄牙国家档案馆承担保存近四十年来所有法庭诉讼记录(the protocols of all court proceedings),确保其可获得。另一方面,美国国会图书馆正存档联机微博服务Twitter上自2006年开始以来所发布的所有公开条目,考虑到每条有5千万条推发出,这个任务并不简单,自然不可能手工完成。而据介绍,Goportis正开始一项大量数据的数字保存计划,来自三个德国国家图书馆的馆藏,目标是把数字保存作为一项永久任务,集成进现有图书馆环境。
会议强调协作的重要性:国际合作与跨机构交换是成功实施这些任务的先决条件。最基本的是知道数字保存这个非常动态的领域正进行什么,国际合作与交流是基础,“分享什么行……什么不行”。
会议网站(Digital Preservation Summit 2011)有详细信息,包括所有PPT。
Via IFLA-L: Summit meeting for digital preservation: preserve global knowledge! / NINA STOFFERS