W3C推荐标准《万维网数据最佳实践》

万维网数据最佳实践(Data on the Web Best Practices, DWBP) 2015年2月发布为草案,而后成为W3C推荐标准。当前版本2017年1月31日:Data on the Web Best Practices, W3C Recommendation 31 January 2017.

近年使用 Web 发布的数据持续增长:世界各国政府在线共享开放数据,研究数据联盟(RDA)等组织鼓励研究数据在线发布,社交数据的收集、分析和在线发布媒体数据,信息的众包,网络上重要文化遗产收藏,以及关联开放数据云。数据发布者旨在公开或以受控访问共享数据。

数据发布者旨在公开或以受控访问共享数据,数据消费者则希望能够找到、使用和链接到数据,这就产生了在数据发布者和数据消费者之间达成共识的基本需求。为界定 Web 上数据最佳实践的范围并引出所需的功能,DWBP 工作组编制了一组用例,代表数据通常如何在 Web 上发布以及如何在被使用,由用例派生的需求集用于指导最佳实践的开发。为鼓励数据发布者采用 DWBP,确定了8个益处:理解、可处理、可发现、重用、信任、可链接、使用权(访问/获取)和互操作,并与用例/最佳实践相关联。

虽然 DWBP 建议使用关联数据,但也鼓励其他开放格式(如 CSV)网络数据的最佳实践。

文件主要部分是第8节最佳实践的例子,内容包括:为什么,预期结果,可能的实施方法,人读、机读样例,如何测试,证据(相关需求)及益处等部分。以下是第8节最佳实践清单与第11节最佳实践益处合并处理后的表格(数字代表益处提及顺序)。

8.最佳实践/BP(益处)C理解P可处理D可发现R重用T信任L可链接A访问/获取I互操作
8.2Metadata
BP1,提供元数据(RCDP)
2431
BP2,提供描述元数据(RCD)231
BP3,提供结构元数据(RCP)231
8.3Data Licenses
BP4,提供数据许可证信息(RT)
12
8.4Data Provenance
BP5,提供数据出处信息(RCT)
213
8.5Data Quality
BP6,提供数据质量信息(RT)
12
8.6Data Versioning
BP7,提供版本指示(RT)
12
BP8,提供版本历史(RT)12
8.7Data Identifiers
BP9,使用永久URI作为数据集标识符(RLDI)
3124
BP10,使用永久URI作为数据集中的标识符(RLDI)3124
BP11,为数据集版本和系列赋予永久URI(RDT)213
8.8Data Formats
BP12,使用机器可读标准化数据格式(RP)
21
BP13,使用与区域设置无关的数据表达(RC)21
BP14,以多种格式提供数据(RP)21
8.9Data Vocabularies
BP15,重用词表、最好是标准化的(RPCTI)
32145
BP16,选择正确的形式化级别(RCI)213
8.10Data Access
BP17,提供批量下载(RA)
12
BP18,提供大数据集的子集(RLAP)4123
BP19,使用内容协商提供多种格式的数据(RA)12
BP20,提供实时访问(RA)12
BP21,提供最新数据(RA)12
BP22,为不可用的数据提供解释(RT)12
8.10.1Data Access APIs
BP23,通过 API 提供数据(RPIA)
2143
BP24,使用 Web 标准作为 API 的基础(RLIDAP)641253
BP25,为 API 提供完整文档(RT)12
BP26,避免对 API 进行重大更改(TI)12
8.11Data Preservation
BP27,保留标识符(RT)
12
BP28,评估数据集覆盖范围(RT)12
8.12Feedback
BP29,收集数据使用者的反馈(RCT)
213
BP30,提供反馈渠道(RT)12
8.13Data Enrichment
BP31,通过生成新数据来丰富数据(RCTP)
2413
BP32, 提供补充演示(RCAT)2143
8.14Republication
BP33,向原始发布者提供反馈(RIT)
132
BP34,遵守许可条款(RT)12
BP35,引用原始出版物(RDT)213

图书馆自动化系统的预约功能

近年一直在做Folio系统的界面汉译,最近又刚译完了Folio术语表,觉得涉及的图书馆自动化系统(ILS或LAS)的功能挺复杂的。这篇谈谈预约功能。

图书馆首先需要确定预约政策。比如什么文献可以预约、哪类读者可以预约,等等。再比如,如果有读者预约,是否要缩短在借读者的借期?有人觉得在借读者会觉得不公平:凭什么自己被缩短借期,后借者倒可能有正常借期?

其实借阅政策由很多因素组合设置。就预约而言,如果借期本就不长,缩短正被预约图书的借期确实不尽合理;但如果借期足够长、提前归还不一定影响读者使用;尤其是当图书馆对某类读者(比如教师)不设定借期(可长期借阅),则在有预约时要求尽早归还更是十分必要。另一方面,读者预约自然是需要借,但有时也并不需要立时三刻到手,只要在被归还后能借到就可以——这也是大部分“预约”实现的功能。

预约需要或者不需要在借读者提前归还,在ILS中有不同的处理方法。folio中对应2种请求(request),即召回(Recall)和预约/等候(Hold)。相信对于未设借期的图书资料(Item),会自动实施“召回”请求。如果有多人预约,则按先后排队(request queue),但召回请求优先。

除以上两种,还有一种情况也被归入“预约”,即闭架书库或异地馆藏中的在架书,需要由馆员处理取书。在folio中称为传呼(Page)【想起手机之前的BP机——寻呼机】。

总结Folio中的三种请求(预约)及ILS可能需要的处理:

一、预约(Hold)

Item归还(如果超期、可能罚款)——(如果读者选定取书地与归还地不同、需要先转运)——放到预约架(hold shelf / on hold)——给请求者发预约在架通知、等候借出

二、召回(Recall)

根据借期政策、修改item到期时间——给借阅者发催还通知(Reminder )——Item归还(如果超期、可能有更高罚款)……【同Hold】

三、传呼(Page)

馆员根据索书号到书库/书架取书 ……【同Hold】

接下来,请求(预约)可能进行中(Open)、也可能已结束(Closed),其状态分别是:

  • 未结请求(open request):尚未满足(Not yet filled),转运中(In transit),等候取件(Awaiting pickup)
  • 已结请求(closed request):已满足(Filled),取消(Cancelled),取件过期(Pickup expired),未满足/无法满足(Unfilled)

说明:request未译“预约”,是因为还有 purchase request(购买请求/荐购)

开源学术交流工具集锦:学术交流技术目录

开放获取机构库联合会(COAR,Confederation of Open Access Repositories)委托咨询机构Antleaf制作“学术交流技术目录”(SComCat),作为其下一代图书馆出版(Next Generation Libraries Publishing)项目的一部分,以CC 4.0许可发布。
Scholarly Communication Technology Catalogue

包括学术交流开放技术的目录(知识库),其中“技术”指软件及某些基本运行服务。目录概述每种技术的的功能、组织模型、依赖关系、标准使用以及采用水平,意在帮助潜在用户选择决定采用的技术。收录范围包括可以本地采用的工具、平台和标准,支持学术交流生命周期中的一项或多项功能,包括:创建、评估、出版/发布、传播、保存和重用。

本目录现列有81项开源技术或服务,包括如发现平台Blacklight,机构库DSpace、Fedora,电子资源使用标准Counter,研究数据管理应用Dataverse等。

选择选项(分面)包括:

  • 类别(应用、软件组件、软件框架、软件包、标准)
  • 馆藏(机构库相关)
  • 功能(如写作、数据挖掘、计量等)
  • 治理(如社区、非营利组织等)
  • 运营形式(如商业提供者、财政资助、志愿社区等)
  • 采用水平(普及、重要、有限、单个、未分类)
  • 可用水平(TR3/总体方案评审、TR9、未分类)
  • 状态(活跃维护、最低维护、已不支持)

详细信息包括(以Blacklight为例):

  • 最近更新 Last updated: 2021-01-27 12:33 UTC
  • 简介 Description: Blacklight is an open source Solr user interface discovery platform. You can use Blacklight to enable searching and browsing of your collections. Blacklight uses the Apache Solr search engine to search full text and/or metadata. Blacklight has a highly configurable Ruby on Rails front-end. Blacklight was originally developed at the University of Virginia Library and is made public under an Apache 2.0 license.
  • 主页 Homepage: http://projectblacklight.org/
  • 代码 Codebase: https://github.com/projectblacklight/blacklight
  • 路线图 Roadmap:
  • 托管 Hosting:
  • 许可证 Licensing: http://www.apache.org/licenses/LICENSE-2.0
  • 价格 Pricing: free to use
  • 采用水平 Adoption level: Significant
  • 可用水平 Readiness level: TR9
  • 治理 Governance: Community (ad-hoc)
  • 运营形式 Business Form: Not Classified
  • 状态 Status: Actively Maintained
  • 类别 Categories: Software Component
  • 功能 Functions: Discovery
  • 馆藏 Collections: 
  • 通用标签 General Tags:

另外,侧栏还提示相关技术

  • Is depended on by * Samvera
  • Depends on * Solr
  • Base technologies * ruby