电子书50年=古腾堡计划50年

今天是古腾堡计划(Project Gutenberg)50周年。古腾堡计划是电子书的起点,因而今年也是电子书50周年。

古腾堡计划最初目标是到20世纪末包含1万种最常用公版书,在2011年7月40周年时已有3.6万,2015年9月达5万,目前已超过6万。

创始人迈克尔·哈特(Michael Hart)在计划40周年后不久过世。1971年7月4日,迈克尔·哈特在伊利诺伊大学读大一。夏日炎炎,他不打算步行数英里回家、几个小时后又要返回学校,而是决定在学校材料研究实验室的施乐 Sigma V 主机上过夜。在去实验室路上,他到一家小杂货店买点东西过夜。除了杂货外,店里还有人造羊皮纸本的《美国独立宣言》,不知道为什么他一起买下了。之前他都是借用哥哥好友账号,当晚他收到了自己第一个电脑账号,发现有巨额计算机资金(即几乎无限的计算机时间),因此决定要做些非常有价值的事情来回馈。在清空杂货店的购物袋时,《独立宣言》掉了出来,像卡通和漫画中那样、光从他头上闪过,他认为计算以及互联网的未来将是“信息时代”,于是他用大写(当时还没有小写)录入《美国独立宣言》,文件大小5K,还在前互联网时代,他给100个用户发送了一条消息,有6个用户下载。此书因此成为古腾堡计划的基石。

以上故事出自Marie Lebeyt的《电子书简史》(A short history of ebooks),可在Internet Archive平台阅读下载。

2015年此作者还总结过《电子书时间线》(1971-2005)(eBooks — timeline),有助于了解电子书相关历史,不少经历过、有印象。略举一些如:

  • 版权(1984年Richard Stallman写下首个可免费使用与修改的copyleft许可/相对于copyright;2002发布首个创作公用/知识共享CC许可;2002布达佩斯开放获取倡议(BOAI))
  • 电子辞典(1986年Franklin发布首个手持电子辞典)
  • Web浏览器(1993年第1个Mosaic,1994年第2个Netscape Navigator,1995年微软的Internet Explorer)
  • 在线辞典(1995年Robert Beard创建A Web of Online Dictionaries,Tyler Chambers创建Internet Dictionary Project (IDP)协作 创建免费在线双语词典计划)
  • 电子墨水(1995年施乐Palo Alto研究中心开发Gyricon,2000年成立公司;2004年E Ink公司上市首个电子墨水屏)
  • 在线书店(1995年亚马逊amazon.com
  • PDA(1996年首个Palm Pilot)
  • 标准(1996年DAISY;1999年Open eBook (OeB)/2007被EPU取代)
  • 免费即时在线翻译(1997年AltaVista翻译巴比鱼(Babel Fish),2007谷歌翻译)
  • 电子阅读器(1998年首个Rocket eBook,1999年第2个SoftBook Reader;2004年索尼首个电子墨水屏阅读器LIBRIe;2007亚马逊Kindle)
  • 柔性显示屏(2000年Plastic Logic)
  • 维基(2000年作为协作网站开始流行,2001年维基百科发布)
  • 智能手机(2000年首部智能手机诺基亚9210,2007苹果iPhone)
  • U盘(2000年)
  • 平版电脑(2010苹果推出iPad)

以下是与图书馆有关的内容(及相关背景节点):

  • 1971:古腾堡计划
  • 1971:OCLC为俄亥俄州的大学图书馆开启联机联合目录(Online Union Catalog),后改称WorldCat;2006年提供免费在线版worldcat.org
  • 1977:国际图联(IFLA)创建UNIMARC作为图书馆目录的通用书目格式;1996欧盟委员会在成员国推广UNIMARC
  • 1980:研究图书馆集团(RLG)创建联合目录RLIN(研究图书馆信息网络),2003年改名RLG联合目录,2004年发布RedLightGreen作为首个免费图书馆在线联合目录,2006年转到WorldCat在线版【RLG被OCLC收购】
  • 1983:互联网开始全球发展
  • 1990:Tim Berners-Lee发明万维网
  • 1990:Unicode(2007取代ASCII)
  • 1992:瑞典首个公版书数字图书馆Projekt Runeberg
  • 1993:John Mark Ockerbloom创建Online Books Page方便访问互联网上可免费获取的图书
  • 1993:世界藏书家协会(ABU)创建首个法语公版书数字图书馆
  • 1993:PDF发布
  • 1994:德国首个公版书数字图书馆Projekt Gutenberg-DE
  • 1994:首个图书馆网站——芬兰的赫尔辛基公共图书馆
  • 1994:W3C成立,为万维网开发协议
  • 1995:互联网公共图书馆(IPL),首个编目网站与网页的公共数字图书馆
  • 1995:欧洲若干国家图书馆创建共同网站Gabriel(加百列);1997新版Gabriel作为欧洲国家图书馆的三语门户网站;2004创建European Library取代Gabriel
  • 1996:Brewster Kahle成立互联网档案(Internet Archive, IA),存档互联网和万维网;2001年发布时光机Wayback Machine;2005发布开放内容联盟(OCA)提供世界公共数字图书馆【不知是否即2006年上线的Open Library,https://openlibrary.org/
  • 1997:法国国家图书馆发布数字图书馆Gallica【https://gallica.bnf.fr】,包含3千种19世纪的数字图书;2006年提供9万图书、8万图片;2010年提供100万文献
  • 1997:不列颠图书馆上线OPAC
  • 1997:日内瓦联合国图书馆开放了它的“网络空间”(cyberspace),有 24 台计算机连接到互联网,可供所有人使用。
  • 1998:法国里昂市图书馆在其网站上提供其珍本的数字化插图。
  • 2000:百万图书计划(Million Book Project),7年后达到目标【中国参与方CADAL】
  • 2000:科学公共图书馆(PLOS)创立,推动免费访问科学和医学期刊;2003年出版首批免费在线期刊、所有文章均为CC许可
  • 2000:不列颠图书馆网站提供谷腾堡印刷的初版《圣经》的数字化版本
  • 2003:MIT创建开放课件(OCW)免费提供课程资料;2005年成立OCW联盟,一年后100所大学参与
  • 2004:谷歌印刷Google Print(2006年改名谷歌图书Google Books),谷歌学术Google Scholar
  • 2006:欧盟致力于欧洲数字图书馆项目,2008年发布Europeana
  • 2010:美国国会图书馆开始存档公开推文
  • 2013:创建DPLA作为美国所有图书馆、档案馆和博物馆的共同数字图书馆

BIBFRAME本体2.1版发布(4层确认)

美国国会图书馆(LC)赶在BIBFRAME更新论坛于2021/6/29召开前,发布了BIBFRAME本体的2.1版(之前为2.0.1版),涉及50个类与属性的变化。美国国会图书馆网络开发与MARC标准办公室主任Sally McCallum在BIBFRAME邮件组中说明,其中绝大多数来自社区中一直在使用Bibframe词表和模型的实施者,并表示感谢。 见:BIBFRAME Ontology Updated / McCallum, Sally (2021-6-24)

LC网站上有修订后的本体:http://id.loc.gov/ontologies/bibframe。主要讨论场所则在GitHub:https://github.com/lcnetdev/bibframe-ontology

LD4社区应该是所指的重要实施者,BIBFRAME本体中有4个属性(awards、custodialHistory、dimensions、fontSize)在编辑附注中注明“请参阅 ARM Ontology(艺术与珍本资料本体) 以了解更详细地对此信息建模的策略”。【参见:BIBFRAME扩展:bibliotek-o(及ArtFrame和RareMat)(2018-5-1)】

Kevin Ford昨天在BIBFRAME的GitHub中发了上百条评论、包括关闭问题,涉及对建议的处理结果,如在BF中声明FOAF命名空间等,特别有一条解释新增的Hub类。之前在某PPT已经见过Hub,此评论可认为是官方解释。概言之,Hub为作品的子类,对应于RDA作品。也就是说,BIBFRAME对应于LRM/RDA的资源四层结构为:Hub—BF作品—实例—单件

Proposal: New class – bf:Hub #75

bf:Hub 的实验始于三年多前(在 LC),并于2019年6月首次公开实例化[用于实例?]。Hub被定义为作品的子类,是抽象资源,充当两个作品之间的桥梁。通过这种方式,它们起到聚合和配置资源的作用。例如,它们使收集马克吐温的《汤姆·索耶历险记》(Tom Sawyer)的所有西班牙语翻译成为可能,或者捕获包含弗朗西斯科·塔雷加(Francisco Tarrega[西班牙吉他演奏家、作曲家])的《随想曲》(Capricho árabe)的其他BF作品。在LC的实验中,Hub作为聚合器执行三个功能:作为主题、作为相关作品以及作为 RDA 意义上的作品。Hubs,作为BF作品,可以作为主题来描述其他作品。

参见:Hub:BIBFRAME模型下的超级作品(2020-6-28)

—— 附:BIBFRAME 2.1的变化 ——

根据Change Notes总结(红字,日期2021-06-09),共86处修改,有些属性涉及多处修改。

一、新增22个类/属性,大致可分成两部分

(一)类(7个)及相应属性(6个)

  • AccessionNumber(登录号,标识符Identifier子类)
  • CollectionArrangement(资料信息的组织)collectionArrangement(资源集合的组织安排)/ collectionArrangementOf,collectionOrganization(资源分成较小单元的方式)
  • Eidr(Entertainment Identifier Registry,标识符Identifier子类)
  • Ensemble(合奏,新增上位类:有子类MusicEnsemble)
  • Hub(中转站/枢纽=桥接两个作品的抽象资源,作品Work子类)
  • Material(材料=资源的物质或组成,新增上位类:有子类BaseMaterial、AppliedMaterial)material(有子属性baseMaterial、appliedMaterial)/ materialOf(有子属性baseMaterialOf、appliedMaterialOf)
  • PubFrequency(资源的出版频率)pubFrequency

(二)原有属性的互逆属性(9个)

adminMetadataFor,agentOf,appliedMaterialOf,arrangementOf,baseMaterialOf,contributionOf,noteFor,subjectOf,titleOf

二、其他修改

  • 1、因新增上位类导致的变化(AppliedMaterial、BaseMaterial、MusicEnsemble;appliedMaterial、baseMaterial、ensemble、ensembleType)
  • 2、修改标签(MovementNotation、MusicNotation、Script、TactileNotation、mount)
  • 3、修改定义(Arrangement、Event、GenreForm、Mount、Urn;arrangement、ensemble、expressionOf、hasExpression、originDate、originPlace、relatedTo)
  • 4、修改/增加附注(Classification、Identifier、Note;awards、custodialHistory、dimensions、fontSize)
  • 5、修改Comment(hasPart、partOf:也用于Event)
  • 6、修改上位属性(otherEdition)
  • 【以下定义域/值域的修改基本上是为减少对使用的限制】
  • 7、扩大定义域/用于(appliedMaterial、assigner、baseMaterial、issuedWith、otherPhysicalFormat、subject、title)
  • 8、移除定义域/用于所有资源(electronicLocator、firstIssue、frequency、geographicCoverage、lastIssue)
  • 9、扩大值域/期望值(colorContent、extent)
  • 10、移除值域/期望值为所有资源或取值(acquisitionSource、agent、appliedMaterial、assigner、baseMaterial、derivedFrom、descriptionModifier、genreForm、grantingInstitution、heldBy、issuedWith、originPlace、place、source)
  • 11、修改值域(hierarchicalLevel、pattern)

资源描述国家标准(GB3792-2021)发布

上周收到宋文老师邮件,GB/T 3792-2021 信息与文献——资源描述 国家标准已经正式发布。今天看国家标准全文公开系统:

  • GB/T 3792-2021信息与文献 资源描述
  • 发布日期 2021-03-09;实施日期 2021-10-01;归口单位 全国信息与文献标准化技术委员会
  • 代替《文献著录》系列(GB/T3792.1-2009总则,GB/T3792.2-2006普通图书,GB/T3792.3-2009连续性资源,GB/T3792.4-2009非书资料,GB/T3792.6-2005测绘制图资料,GB/T3792.7-2008古籍,GB/T3792.9-2009电子资源)及GB/T3469-2013(信息资源的内容形式和媒体类型标识),是对这8项标准的合并修订。
  • 起草单位:中国科学院文献情报中心、国家图书馆、北京大学图书馆、清华大学图书馆、华东师范大学图书馆、广东省立中山图书馆、上海图书馆、中国科技信息研究所、首都图书馆、中央音乐学院图书馆、中国社会科学院图书馆。
  • 主要起草人:宋文、王洋、喻爽、杨慧、胡小菁、鲍国强、毛凌文、毛雅君、纪陆恩、朱学军、魏来、张娟、王宁宁、沈正华、袁玉红、黄丽婷。

本标准未归入“采标”即不属于采用国际标准, 提供在线浏览,也是福利。只可惜文字无法搜索、复制乱码。

购买链接:信息与文献 资源描述. 中国质检出版社. 大16开. 页数148. 104元.

参见:国家标准全文公开系统(2017-3-18)

—— 参与起草过程 ——

作为曾经的全国信息与文献标准化技术委员会文献著录分技术委员会(TC4/SC6)委员,这是我唯一参与起草的国家标准。回想本标准上线的漫长过程,主持者真是不容易。

本标准始于2012年,年初(2012/3/29)参加了“文献著录ISBD统一版专家研讨会”(参见博文)。当时打算将GB3792拆分成10个分标准,我无意参与;后来根据标准化管理委员会的意见,将10个标准合并为一个总标准,进行国家标准的申报【见:《全国信息与文献标准化技术委员会简报》第二期,2013年2月4日】,列入了2012年国家标准制修订计划项目。

2013年正式启动,2013/6/25参加了“资源描述国家标准项目启动会”(参见国家图书馆鲍国强老师的博文:“资源描述国家标准项目启动会”召开 (2013-06-27))。会上首遇搭档、社科院文献中心的黄丽婷老师,两人合写载体表现部分(10载体形态项)。要求9月底前完成,实际8月中旬基本完成。

2014年开了两次会,上半年(2014/3/25-26)参加“资源描述国家标准讨论会”,会议明确编写原则即标准撰写的一些特定说明,我针对载体形态项的撰写初稿作了说明。下半年(2014/10/13)参加“资源描述国家标准研制工作会议”,当时确定的进展是:1)各部分根据10月13日讨论结果修改内容,在11月15日提交宋文;2)2014年12月底以前完成资源描述1.0版,发给大家;3)2015年1月-5月各部分梳理专门类型资源、遗留问题再讨论;4)2015年6月完成资源描述2.0版(专门类型资源审校完成);5)2015年12月完成终稿。

2015年受邀参与总审校,但没有参加2015/11/23的最后一次工作会议。

2016年中还参与了QQ群中的细节讨论。之后就是漫长的等待、音讯全无……我还以为胎死腹中了。