高校图书馆作为学术出版社:书目及概述

一索即得的数字时代,Charles W. Bailey仍在孜孜不倦地做书目,在“数字学术”网站。值得专门做书目的,可以认为是热门话题,或者体现某种潮流。该网站始于1989年,现设置3个版块:数字学术概述数字监护/数字保存作品开放获取作品,每个包含数量不等的不同专题书目。如果要做相关研究,不妨浏览下。
本博中介绍过的有:
数据监护书目(Data Curation:数据监护?数据保管?2011-5-22)
替代计量学书目(替代计量学(Altmetrics)备记,2014-6-1)
研究数据管理书目(研究数据管理书目(2009-2017),2018-4-19;数据监护书目第9版)

最新发布的是《高校图书馆作为学术出版社书目》(2018),归在“开放获取”版块:
Academic Library as Scholarly Publisher Bibliography / Charles W. Bailey, Jr. (7/25/2018)
书目导言是对此主题的概述。看完才知道,“数字学术”网站就出自图书馆出版的最初践行机构——休斯顿大学图书馆。
via [DIGLIB] Academic Library as Scholarly Publisher Bibliography / Digital Scholarship (2017-7-25)

下月在马来西亚首都吉隆坡召开的IFLA 2018年会上,将有一个图书馆出版分会场,正是此书目对应的主题。通知称会议将讨论开发一个提交给IFLA的行动计划(Action Plan),探讨成立一个特殊兴趣小组(Library Publishing SIG)——足以说明这是一个“快速成长的实践领域”。
via [IFLA-L] Please Join Us! 2018 WLIC – Formation of IFA’s Library Publishing SIG / Ann Okerson (2018-7-26)

翻译《高校图书馆作为学术出版社书目》导言附后,了解一下英语国家现状——最后关于大学出版社的,离我们实在太过遥远。当然,北京大学期刊网是个很好的样版。
[说明:university libraries=大学图书馆;academic libraries=高校图书馆]

—–《高校图书馆作为学术出版社书目》导言—–
《高校图书馆作为学术出版社书目》包括超过125种精选英文文章、书籍和技术报告,这些文章有助于理解自1980年代后期以来高校图书馆的数字学术出版活动,特别是他们的开放获取图书和期刊出版活动。参考书目涵盖以下子主题:1980年代和1990年代开创性的高校图书馆出版项目,图书馆员(不同于图书馆)出版的早期数字期刊和连续出版物,自布达佩斯开放获取倡议以来基于图书馆的学术出版,技术出版基础设施,以及图书馆和大学出版社合并/合作伙伴关系和其他相关工作。

这是图书馆出版联盟(Library Publishing Coalition, LPC)对图书馆出版的定义
LPC将图书馆出版定义为由大学和大学图书馆领导的一系列活动,以支持学术、创意和/或教育作品的创作、传播和保管。
通常,图书馆出版需要一个制作过程,提供以前没有提供的原创作品,并对发布的内容应用一定程度的认证,无论是通过同行评审还是通过机构品牌的扩展。
基于核心图书馆的价值观,并以图书馆员的传统技能为基础,它与其他出版领域的区别在于偏好开放获取传播,以及愿意接受非正式和实验形式的学术交流并挑战现状。

从1980年代末开始,大学图书馆是互联网上数字学术期刊的首批出版社之一。在休斯顿大学图书馆馆长Robin N. Downes的批准和支持下,开放获取期刊《公共访问计算机系统评论》(The Public-Access Computer Systems Review)于1989年8月启动,第一期于1990年1月出版。1991年,弗吉尼亚理工大学图书馆出版了第一期《国际酒店研究学院期刊》(Journal of the International Academy of Hospitality Research)。在《2018年图书馆出版目录》中,弗吉尼亚理工大学图书馆列名出版五个“基于校园的学生驱动的期刊”和六个“根据外部团体合同/谅解备忘录生产期刊”。斯坦福大学图书馆于1995年建立了HighWire出版社,出版了《生物化学杂志》(Journal of Biological Chemistry)作为其第一份期刊。截至2015年3月,HighWire Press总共发表760万篇文章,其中240多万篇为开放获取文章。经过Downes的批准,休斯顿大学图书馆于1996年10月开始出版《学术电子出版书目》,这是一本开放存取的书籍。这本数字图书在1996年至2006年期间更新了64次。
1990年代由大学图书馆参与的数字期刊出版项目包括:欧几里德项目(Project Euclid,康奈尔大学图书馆和杜克大学出版社),BioOne项目(堪萨斯大学,Big 12 Plus图书馆联盟和其他合作伙伴),缪斯项目(Project Muse,约翰霍普金斯大学出版社和米尔顿艾森豪威尔图书馆)。
图书馆员出版的早期数字期刊和连续出版物包括:……【略】
在1990年代,大学图书馆也是主要学术出版社风险投资的重要数字期刊出版测验场,如CORE项目、红色Sage项目、SuperJournal项目和TULIP项目。……【略】
过去的16年中,学术和其他图书馆一直在不断出版图书、期刊和其他作品。这种复苏活动是由开放获取运动推动的,通常被视为从2002年布达佩斯开放获取倡议开始。高校图书馆建立了组织和技术基础设施来支持这一运动,通常使用为了推进它而创建的开源软件。对OA运动的越来越多的承诺引发了图书馆的重要文化变革,导致了由他们支持的机构知识库、学术交流部门和研究数据支持部门的激增。
“公共知识项目”(Public Knowledge Project)中的开源软件,如开源期刊系统(Open Journal Systems),经常用于基于图书馆的出版项目,不过也使用各种软件工具。有希望的新开源出版项目正在兴起,如Fulcrum、Hypothesis、Janeway、Manifold、PubPub、PubSweet、Scalar和Vega,但在本书目所涵盖的作品类型中没有很好地表现出来。
大学出版社正处于变革和重组的时期。他们越来越多地受到大学图书馆的行政控制。此外,正在建立全新的全数字开放获取大学出版社,通常是在大学图书馆的指导下或与之合作。

研究数据管理书目(2009-2017)

曾在博文“Data Curation:数据监护?数据保管?”(2011-5-22)中提及此书目,现在这个书目更新到了第9版,含2009-2017年著述:
Research Data Curation Bibliography / Charles W. Bailey, Jr. VERSION 9: 4/18/2018

近年国内 Data Curation 研究热度不减,CNKI收录文章在2016年达到峰值95篇,2017年第2高值73篇。查该术语翻译五花八门,大致有:管护、监管、监护、策管、策展、管理。以我的理解,在图情领域,Data Curation 约等于 Research Data Management (RDM),本书目中有大量文章含后一术语,比data curation更多,因此觉得不妨用“管理”一词更具包容性。

要做研究数据管理,这个书目是不错的参考源。
本书目收录750种精选英文文章、图书和技术报告,含访问链接,在不违反版权的情况下也包括摘要。内容涉及:研究数据创建、采访、元数据、出处、存储库、管理、政策、支持服务、资助机构要求、开放获取、同行评审、出版、引用、共享、重用和保存等主题。
比较可惜的是,书目是按作者字顺排序,没有对论著做简单的分类以方便浏览。也没有嵌入引文数或替代计量数值,辅助评估选择。

关于 data curation,本书目在导言中引用 Christopher A. Lee 和 Helen R. Tibbo 对 digital curation 的定义:
“digital curation涉及创作者和档案工作者的选择和评估,不断提供智力接入,冗余存储,数据转换,并且对于一些材料而言承诺长期保存。digital curation是管理(stewardship),提供认证数字数据和其他数字资产的可重复性和重复使用。开发值得信赖和耐用的数字储存库,声音元数据创建和捕获的原则,使用文件格式和数据编码的开放标准,以及提高信息管理素养,对于数字资源的长期使用和curation工作的成功都至关重要。

学术报告“另一个视界”与上图数字人文项目

出于对可视化的兴趣,周五(2017.8.11)去上海图书馆听学术报告。感谢上图开放学术资源让大家共享。

另一个视界:清华大学美术学院向帆副教授和朱舜山工程师学术讲座

会议通知中推荐的报告人微信公众号文章:
《数据追问-全国美展油画作品视觉化解读》
《我是不是有点皇亲国戚?》

报告安排在下午。可惜我在开讲没多久,就因收到私事信息急需处理,差不多一半时间在边听边开小差上网中。所幸前一晚先做了点功课,看过两位报告人的网站Z Lab,特别是其中的 Projects 板块,还能勉强跟上所讲内容。Z Lab网站共有11个项目(没有上述利用CBDB数据的家谱图),看过感觉一是可视化效果很酷炫(如微博地点钟的24小时);二是可视化设计也被作为一种实用的研究辅助工具(如热带森林数据可视化)。
本次报告涉及了Z Lab网站半数以上项目,听现场讲述比看介绍生动很多,尤其对“为什么会这么做”的解释,光看介绍是获取不到的。向帆老师把她的项目定位为现代艺术作品,而不是数字人文(或其他),至于被其他人用作分析工具,也被她视为作品的一部分,全国美展获奖作品分析就是一个典型例子。我的感觉,比如在CBDB家族谱系图、热带森林数据等,可视化应该更多是作为工具。当然由于向老师的美术背景,或许在设计时是作为艺术创作看待的。
问答阶段,向老师提到她也做了不少文本挖掘项目,比如张爱玲、海明威……,数字人文无疑。
听完比较“失望”的是,那些酷炫的效果,大多是朱舜山老师用代码写出来的,没有利用太多工具。视觉设计不易,实现也不具有可复制性。因此,只能是艺术品?两位老师珠联璧合,看得出在性格上也属互补型的。

——— 上海图书馆数字人文项目介绍 ———
当天上午是内部的上海图书馆数字人文项目介绍,希望请两位老师帮助改善可视化界面设计。
刘炜副馆长开场,夏翠娟做总体介绍,上图目前共有7个相关项目:1中国家谱总目(华人家谱总目——上海图书馆家谱知识服务平台),2盛宣怀档案,3名人手稿(上海图书馆名人手稿),4中文古籍联合目录及循证平台,5规范库(含人名、中国历史纪年、地理名词表、收藏机构名录等),6书目库,7上海历史文化时空再造——武康路。其中1、3、4、7后续由各自项目主管(抱歉没听清姓名)做详细演示,尤其是可视化部分。
向老师在看到名人手稿部分时指出:一般的可视化(饼图柱图之类),掩盖了最最让人感动的部分。——话说得没错,只不过图书馆是整理资料的,就像朱老师在整理全国美展获奖作品基础资料时所说的somebody:Somebody has to do the dirty work. 面对海量文献中充满个性化的内容,要当作艺术作品来创作,真的会使项目没有截止期的。
向老师问得最多的问题是:应用场景,用户需求。——或者说用例、故事,确实是需要首先考虑,也是当前图书馆做项目需要强调的,比如最近LD4社群“调和与实体解析工作组”正在征求用例(关联数据的“调和”与“解析”) 。
与邻座tsingove交换意见,作为基础设施的话,有时可能并不针对特定场景(当然那也是场景),提供数据就好,至于怎么用,留给第三方来开发。上图接连两年举办的关联数据竞赛,就是这种设想的体现。夏MM也解释,如古籍系统的某些预设应用,也是咨询过馆内领域专家的,是作为示范,让研究者了解数据可能怎么用,进而提出更多应用场景。
上午会议结束时,Keven总结数字人文项目中三方的角色:图书馆员作为领域专家与计算机开发者之间的桥梁。朱老师补充:要加上第四方设计师,了解用户体验。