电子书50年=古腾堡计划50年

今天是古腾堡计划(Project Gutenberg)50周年。古腾堡计划是电子书的起点,因而今年也是电子书50周年。

古腾堡计划最初目标是到20世纪末包含1万种最常用公版书,在2011年7月40周年时已有3.6万,2015年9月达5万,目前已超过6万。

创始人迈克尔·哈特(Michael Hart)在计划40周年后不久过世。1971年7月4日,迈克尔·哈特在伊利诺伊大学读大一。夏日炎炎,他不打算步行数英里回家、几个小时后又要返回学校,而是决定在学校材料研究实验室的施乐 Sigma V 主机上过夜。在去实验室路上,他到一家小杂货店买点东西过夜。除了杂货外,店里还有人造羊皮纸本的《美国独立宣言》,不知道为什么他一起买下了。之前他都是借用哥哥好友账号,当晚他收到了自己第一个电脑账号,发现有巨额计算机资金(即几乎无限的计算机时间),因此决定要做些非常有价值的事情来回馈。在清空杂货店的购物袋时,《独立宣言》掉了出来,像卡通和漫画中那样、光从他头上闪过,他认为计算以及互联网的未来将是“信息时代”,于是他用大写(当时还没有小写)录入《美国独立宣言》,文件大小5K,还在前互联网时代,他给100个用户发送了一条消息,有6个用户下载。此书因此成为古腾堡计划的基石。

以上故事出自Marie Lebeyt的《电子书简史》(A short history of ebooks),可在Internet Archive平台阅读下载。

2015年此作者还总结过《电子书时间线》(1971-2005)(eBooks — timeline),有助于了解电子书相关历史,不少经历过、有印象。略举一些如:

  • 版权(1984年Richard Stallman写下首个可免费使用与修改的copyleft许可/相对于copyright;2002发布首个创作公用/知识共享CC许可;2002布达佩斯开放获取倡议(BOAI))
  • 电子辞典(1986年Franklin发布首个手持电子辞典)
  • Web浏览器(1993年第1个Mosaic,1994年第2个Netscape Navigator,1995年微软的Internet Explorer)
  • 在线辞典(1995年Robert Beard创建A Web of Online Dictionaries,Tyler Chambers创建Internet Dictionary Project (IDP)协作 创建免费在线双语词典计划)
  • 电子墨水(1995年施乐Palo Alto研究中心开发Gyricon,2000年成立公司;2004年E Ink公司上市首个电子墨水屏)
  • 在线书店(1995年亚马逊amazon.com
  • PDA(1996年首个Palm Pilot)
  • 标准(1996年DAISY;1999年Open eBook (OeB)/2007被EPU取代)
  • 免费即时在线翻译(1997年AltaVista翻译巴比鱼(Babel Fish),2007谷歌翻译)
  • 电子阅读器(1998年首个Rocket eBook,1999年第2个SoftBook Reader;2004年索尼首个电子墨水屏阅读器LIBRIe;2007亚马逊Kindle)
  • 柔性显示屏(2000年Plastic Logic)
  • 维基(2000年作为协作网站开始流行,2001年维基百科发布)
  • 智能手机(2000年首部智能手机诺基亚9210,2007苹果iPhone)
  • U盘(2000年)
  • 平版电脑(2010苹果推出iPad)

以下是与图书馆有关的内容(及相关背景节点):

  • 1971:古腾堡计划
  • 1971:OCLC为俄亥俄州的大学图书馆开启联机联合目录(Online Union Catalog),后改称WorldCat;2006年提供免费在线版worldcat.org
  • 1977:国际图联(IFLA)创建UNIMARC作为图书馆目录的通用书目格式;1996欧盟委员会在成员国推广UNIMARC
  • 1980:研究图书馆集团(RLG)创建联合目录RLIN(研究图书馆信息网络),2003年改名RLG联合目录,2004年发布RedLightGreen作为首个免费图书馆在线联合目录,2006年转到WorldCat在线版【RLG被OCLC收购】
  • 1983:互联网开始全球发展
  • 1990:Tim Berners-Lee发明万维网
  • 1990:Unicode(2007取代ASCII)
  • 1992:瑞典首个公版书数字图书馆Projekt Runeberg
  • 1993:John Mark Ockerbloom创建Online Books Page方便访问互联网上可免费获取的图书
  • 1993:世界藏书家协会(ABU)创建首个法语公版书数字图书馆
  • 1993:PDF发布
  • 1994:德国首个公版书数字图书馆Projekt Gutenberg-DE
  • 1994:首个图书馆网站——芬兰的赫尔辛基公共图书馆
  • 1994:W3C成立,为万维网开发协议
  • 1995:互联网公共图书馆(IPL),首个编目网站与网页的公共数字图书馆
  • 1995:欧洲若干国家图书馆创建共同网站Gabriel(加百列);1997新版Gabriel作为欧洲国家图书馆的三语门户网站;2004创建European Library取代Gabriel
  • 1996:Brewster Kahle成立互联网档案(Internet Archive, IA),存档互联网和万维网;2001年发布时光机Wayback Machine;2005发布开放内容联盟(OCA)提供世界公共数字图书馆【不知是否即2006年上线的Open Library,https://openlibrary.org/
  • 1997:法国国家图书馆发布数字图书馆Gallica【https://gallica.bnf.fr】,包含3千种19世纪的数字图书;2006年提供9万图书、8万图片;2010年提供100万文献
  • 1997:不列颠图书馆上线OPAC
  • 1997:日内瓦联合国图书馆开放了它的“网络空间”(cyberspace),有 24 台计算机连接到互联网,可供所有人使用。
  • 1998:法国里昂市图书馆在其网站上提供其珍本的数字化插图。
  • 2000:百万图书计划(Million Book Project),7年后达到目标【中国参与方CADAL】
  • 2000:科学公共图书馆(PLOS)创立,推动免费访问科学和医学期刊;2003年出版首批免费在线期刊、所有文章均为CC许可
  • 2000:不列颠图书馆网站提供谷腾堡印刷的初版《圣经》的数字化版本
  • 2003:MIT创建开放课件(OCW)免费提供课程资料;2005年成立OCW联盟,一年后100所大学参与
  • 2004:谷歌印刷Google Print(2006年改名谷歌图书Google Books),谷歌学术Google Scholar
  • 2006:欧盟致力于欧洲数字图书馆项目,2008年发布Europeana
  • 2010:美国国会图书馆开始存档公开推文
  • 2013:创建DPLA作为美国所有图书馆、档案馆和博物馆的共同数字图书馆

《开放获取图书的未来》白皮书(附Springer Nature的OA电子书)

Springer Nature集团日前发布白皮书《开放获取图书的未来:全球学术图书作者调查结果》。数据来自2019年2-3月间对全球2,542位学术图书作者的调查回复,其中407位作者以前出版过至少一本OA图书,2037位作者未出版OA图书,98位作者不确定。白皮书提供了图书作者对开放获取(OA)态度的全球观点,包括研究人员出版图书的动机、影响学术界出版OA的参数和关键驱动因素。白皮书还确定了图书作者仍然面临的OA出版的主要障碍:从缺乏对OA出版选项和低资助的知晓,到对OA图书如何被感知的担忧。其他主要发现:

• 初级研究人员、欧洲和亚洲的研究人员以及之前的OA图书作者赞同OA态度更强

• 道德原因(获取平等)和接触更多受众被确定为选择图书OA的关键动机

• 大多数作者希望由OA图书出版物的资助者获得更多财务支持

• 金色OA是OA图书的首选政策

• 出版商的声誉对OA作者的重要性较低,但仍然是出版的决定因素。

白皮书免费下载The future of open access books: Findings from a global survey of academic book authors

Springer Nature在2012年首次推出专门的OA图书出版项目,开放获取图书组合目前包括超过750本涵盖所有学科的书籍,到2018年,全球读者已下载超过3000万章。

Springer Nature开放获取图书项目主页Open access books & chapters

显示有OA图书550+,章节(部分OA的混合图书)280+。侧栏有电子书浏览——链接到开放获取图书清单,目前显示共773种(含仅预览内容)。

via Spinger Nature新闻:The future of scholarly books is open (access)
关于金色OA,参见:开放获取的金科玉律(2009-5-23)

第三届剑桥图书馆馆员活动日摘记

昨天(2014.1.6)在徐家汇上海交通大学参加剑桥大学出版社召开的第三届剑桥图书馆馆员活动日,据介绍前两届分别在台湾和香港召开。说是活动日,其实就是会议听报告,并无其他活动。会议主题“蜕变:为不断发展的学术界打造全新的图书馆”,听说相同活动近日在北京还将有一场。

剑桥大学出版社西蒙·罗斯(Simon Ross)把开幕致词变成了半个报告,题为“学术出版,路在何方”,谈该社应对市场环境变化的一些设想。一开始放了几个对照图,显示全球各地图书馆经费情况,除亚太地区在增长,其他地区都持平甚至下降,不免令我想到竹帛斋主最近吐槽数据库商涨价(“十问数据库商!!!”)。我以为,成本+预期收益=售价,其他地区因图书馆预算下降而售价无法与CPI同比提高,导致数据库商预期收益下降,此时亚太地区图书馆预算未受影响,数据库商为维持整体收益,自然对本地区有较高期望——说到底,就是数据库商觉得你有钱!真从经费统计上看不增长乃至下降了,数据库商自然无法再狮子大开口。

回到正题。除两个与该社合作出版的期刊广告外,会上共有6个报告,加上开幕致词,我总结热点为4个关键词:
开放获取(OA)、开放课程(MOOC)、发现系统、电子书
——最近MOOC大热,对于图书馆如何融入在线教育环境或在其中发挥作用,无论是此次会议还是其他地方,我都还未获知任何有启发的看法。

个人印象最深的是丹佛大学图书馆学术交流与馆藏服务副馆长Michael Levine-Clark分别在上下午的二个报告,分别是关于发现系统和电子书的大规模统计,做得相当细致,其方法值得借鉴,收到PPT后待详看:
1、Discovery or not? A major longitudinal study of the effect of web-scale discovery systems on online journal usage(发现与否?网络规模发现系统对在线期刊使用的影响的重要纵向研究)
这个由多所大学合作的项目,针对4家最流行的发现系统,试图研究使用发现系统是否对电子期刊的使用存在影响。每家发现系统选6所共24所图书馆(其中20所美国,英国、澳大利亚、加拿大、新西兰各1所),对于来自6家出版商的有完整24个月(实施前后各一年、以学期为界)counter数据的期刊进行使用对比,排除异常值(偏离较高的100多个),对数据进行统计分析:到底是图书馆、出版商还是发现系统对使用造成了影响?
有一个结论很有意思:发现系统对不同出版商影响不同,有的期刊在使用发现系统后使用反而下降
2、E-books’ impact on print(电子书对纸本图书的影响)
首先介绍丹佛大学5年中纸书购买下降50%,电子书中非永久性的也在增长(即重使用、轻收藏,或曰access vs ownership问题)。三类电子书采购方式:1、直接(单本、打包);2、永久,订购(打包);3、需要驱动采购DDA(无授权、STL、购买)。
调查针对丹佛大学图书馆购买的杜克大学出版社2008年的电子书,同时也购买纸本,在2009-2012每年年底统计使用。当然两种“使用”含义是不同的:纸书按借次,不同读者借期不同、借后实际使用不明;而电子书计算每次访问。
从统计观察到现象的一些推测:电子书会促进纸书的使用,反之不然;有些品种电子书和纸书利用均高,说明内容比形式重要。
[对电子书促进纸书使用的联想:常听某些读书人说,看了电子书后觉得不错,就下单买纸书了,大概是同样效应吧]

对我来说,此次参会的一个重要原因是想听上交大李芳的“电子资源自动分类专家系统的设计与实现”,也是她国家社科基金课题“中外分类知识组织体系互操作实证研究”的成果吧。这是我一直关注的基于统计的杜威十进分类法(DDC)与中图法(CLC)对照系统,以前上海图书馆也曾介绍过类似系统,目的是由CLC号给出DDC号,为中文编目数据提交WorldCat用;上交大系统则反之,目的是根据外文电子资源记录中的DDC号给出CLC号。
报告介绍了系统从数据清理、统计计数到数据匹配的过程,以及引入LCSH与CLC相关度计算辅助定类等方法,据评估测试,三级类可完成75%。未来希望实现DDC与CLC的双向映射。
目前系统可由MARC和Excel两种格式输入后输出。系统与商业公司合作,看来是要卖钱的,但在编目日益弱化的情形下,图书馆的需求应该不会太大,外包公司或可以考虑。

另:会议资料除剑桥大学出版社广告外,还有一份Linda Bennett的元数据介绍(Metadata: some brief notes),与会议主题没有太多关系(与发现系统略相关),与我的兴趣倒有些相关——但对元数据的理解与我的不尽一致。Bennett女士的头衔是Library Consultant,主持会议最后阶段的专题讨论,从会议日程资料看似乎是本次会议的策划人。
对于Library Consultant,联想到现任JSC主席Gordon Dunsire、元数据领域的Karen Coyle、图书馆自动化领域的Marshall Breeding等目前也是这种身份,不免好奇这个职业的存在,至少在中国是没有的。什么图书馆会向他们咨询呢?查了下Karen Coyle的联系页面,发现她明码标价着:咨询费每小时100美元,外出报告每场1500美元加旅行费。