图书馆工作流程交流

工作中想优化流程,却缺少思路?2015年两位美国图书馆员 Liz Woolcott 和 Anna Neatrour 创建了“图书馆工作流程交流”网站,旨在帮助图书馆员在机构间共享工作流程和最佳实践。

Library Workflow Exchange

网站收集不同图书馆各项工作流程,涉及采访、电子资源、馆藏建设、编目、元数据、技术服务、馆际互借、展览、数字化、研究数据、学术交流、数字人文、开放存取、长期保存、档案、工具等。

工作流程既有宏观设计(如为开放的文化生态系统设计元数据标准和分类法),也有细小的具体任务(如用MarcEdit收割OAI记录)。

工作流程来自图书馆网站、系统厂商手册、会议报告、文章等,也可以提交自己的工作流程与大家共享。

提供流程概述及详细内容的访问链接。有浏览、检索功能,且持续更新中。

W3C推荐标准《万维网数据最佳实践》

万维网数据最佳实践(Data on the Web Best Practices, DWBP) 2015年2月发布为草案,而后成为W3C推荐标准。当前版本2017年1月31日:Data on the Web Best Practices, W3C Recommendation 31 January 2017.

近年使用 Web 发布的数据持续增长:世界各国政府在线共享开放数据,研究数据联盟(RDA)等组织鼓励研究数据在线发布,社交数据的收集、分析和在线发布媒体数据,信息的众包,网络上重要文化遗产收藏,以及关联开放数据云。数据发布者旨在公开或以受控访问共享数据。

数据发布者旨在公开或以受控访问共享数据,数据消费者则希望能够找到、使用和链接到数据,这就产生了在数据发布者和数据消费者之间达成共识的基本需求。为界定 Web 上数据最佳实践的范围并引出所需的功能,DWBP 工作组编制了一组用例,代表数据通常如何在 Web 上发布以及如何在被使用,由用例派生的需求集用于指导最佳实践的开发。为鼓励数据发布者采用 DWBP,确定了8个益处:理解、可处理、可发现、重用、信任、可链接、使用权(访问/获取)和互操作,并与用例/最佳实践相关联。

虽然 DWBP 建议使用关联数据,但也鼓励其他开放格式(如 CSV)网络数据的最佳实践。

文件主要部分是第8节最佳实践的例子,内容包括:为什么,预期结果,可能的实施方法,人读、机读样例,如何测试,证据(相关需求)及益处等部分。以下是第8节最佳实践清单与第11节最佳实践益处合并处理后的表格(数字代表益处提及顺序)。

8.最佳实践/BP(益处)C理解P可处理D可发现R重用T信任L可链接A访问/获取I互操作
8.2Metadata
BP1,提供元数据(RCDP)
2431
BP2,提供描述元数据(RCD)231
BP3,提供结构元数据(RCP)231
8.3Data Licenses
BP4,提供数据许可证信息(RT)
12
8.4Data Provenance
BP5,提供数据出处信息(RCT)
213
8.5Data Quality
BP6,提供数据质量信息(RT)
12
8.6Data Versioning
BP7,提供版本指示(RT)
12
BP8,提供版本历史(RT)12
8.7Data Identifiers
BP9,使用永久URI作为数据集标识符(RLDI)
3124
BP10,使用永久URI作为数据集中的标识符(RLDI)3124
BP11,为数据集版本和系列赋予永久URI(RDT)213
8.8Data Formats
BP12,使用机器可读标准化数据格式(RP)
21
BP13,使用与区域设置无关的数据表达(RC)21
BP14,以多种格式提供数据(RP)21
8.9Data Vocabularies
BP15,重用词表、最好是标准化的(RPCTI)
32145
BP16,选择正确的形式化级别(RCI)213
8.10Data Access
BP17,提供批量下载(RA)
12
BP18,提供大数据集的子集(RLAP)4123
BP19,使用内容协商提供多种格式的数据(RA)12
BP20,提供实时访问(RA)12
BP21,提供最新数据(RA)12
BP22,为不可用的数据提供解释(RT)12
8.10.1Data Access APIs
BP23,通过 API 提供数据(RPIA)
2143
BP24,使用 Web 标准作为 API 的基础(RLIDAP)641253
BP25,为 API 提供完整文档(RT)12
BP26,避免对 API 进行重大更改(TI)12
8.11Data Preservation
BP27,保留标识符(RT)
12
BP28,评估数据集覆盖范围(RT)12
8.12Feedback
BP29,收集数据使用者的反馈(RCT)
213
BP30,提供反馈渠道(RT)12
8.13Data Enrichment
BP31,通过生成新数据来丰富数据(RCTP)
2413
BP32, 提供补充演示(RCAT)2143
8.14Republication
BP33,向原始发布者提供反馈(RIT)
132
BP34,遵守许可条款(RT)12
BP35,引用原始出版物(RDT)213

《研究数据策展与管理书目》

从IFLA-L邮件组收到《研究数据策展与管理书目》发布的消息,有点奇怪现在居然还在做书目?看了下,带题录,最重要的是,有访问链接(以DOI为主),可以直接访问原文(如果有访问权限),如此可用性大大提高。

书目收录800多条,有HTML版(http://www.digital-scholarship.org/rdcmb/rdcmb-web.htm)和PDF版(http://www.digital-scholarship.org/rdcmb/rdcmb.pdf),PDF版共250页,有封面、版权页、封底。翻译文前部分如下。

Bailey, Charles W., Jr. Research Data Curation and Management Bibliography. Houston: Digital Scholarship, 2021. http://www.digitalscholarship.org/rdcmb/rdcmb.htm.

本《研究数据策展和管理书目》包括超过800精选英语文章和书籍,有助于理解学术和其他研究机构的数字研究数据的策展。

“数字策展”的概念仍在不断发展。Christopher A. Lee 和 Helen R. Tibbo在“数字策展和可信存储库:迈向成功的步骤”中对数字策展的定义如下:

数字策展涉及创作者和档案管理员的选择和评估,不断发展的知识访问提供,冗余存储,数据转换,且对于某些资料承诺长期保存。数字策展是提供真实数字数据和其他数字资产的可复制性和再利用的管理。开发值得信赖和持久的数字存储库,声音元数据创建和捕获的原则,使用文件格式和数据编码的开放标准,以及促进信息管理素养,对于数字资源的寿命和策展工作的成功都是必不可少的。[Christopher A. Lee and Helen R. Tibbo, “Digital Curation and Trusted Repositories: Steps Toward Success,” Journal of Digital Information 8, no. 2 (2007). https://journals.tdl.org/jodi/index.php/jodi/article/view/229 ]

本《研究数据策展和管理书目》涵盖的主题包括研究数据的创建、采集、元数据、来源/出处、信息库、管理、政策、服务支持、资助机构的要求、开放获取、同行评审、出版/发布、引用、共享、重用和长期保存。它的覆盖范围具有高度选择性。

本书目不包括会议录、数字媒体作品(如 MP3 文件)、社论、电子邮件、访谈、致编辑的信件、演示幻灯片或转录文本、技术报告,未发表的电子印刷品或网络博客帖子。

大多数来源发表在2009年1月到12月,但也包括数量有限的早期关键来源。参考书目有包含作品的链接。URL 可能会在没有警告(或自动转向)的情况下更改,或者可能完全消失。在可能的情况下,本参考书目使用数字对象标识符系统 (DOI) URL。初始验证后不会重新检查 DOI。发布商系统可能有临时的 DOI 解析问题。如果链接已失效,请尝试在互联网档案的时光机(https://archive.org/web/)中输入。

如果作品在知识共享署名许可(BY 和国家/国际变体)、知识共享公共领域奉献 (CC0) 或知识共享公共领域标记下,则摘要包含在此参考书目中,这在出版者的文章当前网页中明确声明。注意出版者可能已更改期刊网站上所有文章的许可,但未对期刊的 PDF 文件进行相应的许可更改。当前网页上的许可被认为是正确的。由于出版商可以在未来更改许可,因此本书目中为作品指明的许可可能不是您在检索该作品时找到的许可。

除非另有说明,本书目中的文章摘要采用知识共享署名 4.0 国际许可协议, https://creativecommons.org/licenses/by/4.0/ 。摘要按照源资料中的描述进行复制。

书目【以作者姓氏为序,以下录第1篇作为示例】

Aalbersberg, IJsbrand Jan, Sophia Atzeni, Hylke Koers, Beate Specker, and Elena Zudilova-Seinstra. “Bringing Digital Science Deep inside the Scientific Article: The Elsevier Article of the Future Project.” LIBER Quarterly 23, no. 4 (2014): 275-299. http://doi.org/10.18352/lq.8446 将数字科学深入科学文章:爱思唯尔未来文章项目

In 2009, Elsevier introduced the “Article of the Future” project to define an optimal way for the dissemination of science in the digital age, and in this paper we discuss three of its key dimensions. First we discuss interlinking scientific articles and research data stored with domain-specific data repositories—such interlinking is essential to interpret both article and data efficiently and correctly. We then present easy-to-use 3D visualization tools embedded in online articles: a key example of how the digital article format adds value to scientific communication and helps readers to better understand research results. The last topic covered in this paper is automatic enrichment of journal articles through text-mining or other methods. Here we share insights from a recent survey on the question: how can we find a balance between creating valuable contextual links, without sacrificing the high-quality, peer-reviewed status of published articles?  2009 年,爱思唯尔推出了“未来文章”项目,以定义数字时代科学传播的最佳方式,在本文中,我们将讨论其三个关键维度。首先,我们讨论将存储在特定领域数据存储库中的科学文章和研究数据相互链接——这种相互链接对于有效和正确地解释文章和数据至关重要。然后,我们展示了嵌入在线文章中的易于使用的 3D 可视化工具:这是数字文章格式如何为科学传播增加价值并帮助读者更好地理解研究结果的一个关键示例。本文涉及的最后一个主题是通过文本挖掘或其他方法自动丰富期刊文章。在这里,我们分享最近关于这个问题的调查的见解:我们如何在创建有价值的上下文链接之间找到平衡,同时又不牺牲已发表文章的高质量、同行评审状态?