蒂姆•伯纳斯-李《编织万维网》笔记

本月4日,万维网发明人 Tim Berners-Lee 获得2016年度ACM图灵奖(W3C官方声明中文版)。图灵奖是计算机科学领域的最高奖项,也被形容为“计算领域的诺贝尔奖”。
文因互联CEO鲍捷次日发表“WEB的50年——从TIM BERNERS-LEE的图灵奖说起”,详述万维网的过去、现在及未来,以及Tim Berners-Lee的贡献。文章的关注点在语义网,作者认为以2012年Google知识图谱发布为标志,语义网已经开始加速。
文中提到Tim Berners-Lee的《Weaving the Web》一书有中文版。马上到图书馆网站,把早已进入闭架书库的书预约借出。拿到手后,惊讶地发现,中文版竟然与原版同一年出版——1999年互联网在国内还远没有普及,真是难能可贵。

蒂姆•伯纳斯-李,马克·菲谢蒂;萧风,张宇宏译. 编织万维网:万维网之父谈万维网的原初设计与最终命运. 上海译文出版社, 1999
Tim Berners-Lee, with Mark Fischetti. Weaving the Web : the original design and ultimate destiny of the world wide web by its inventor. Harper Collins Publishers, 1999.

作为万维网发展史,本书前半部分按时间排列,从父母在英国参与设计世界上第一台商业计算机,到作者1980年代在日内瓦的欧洲原子能研究中心(CERN)工作、1989年发明万维网,然后精心推动万维网的发展,到1994年去美国主持成立万维网联合会(W3C) 。
看的过程中发现自己以前对因特网、互联网、万维网真是傻傻分不清。1960年代出现的因特网/互联网,作为网络基础设施,运行有各种协议,万维网(HTTP协议)通过包容其他协议(比如曾经用过的昙花一现的wais,再比如至今仍有很强生命力的ftp),迅速将互联网上已有内容呈现在万维网浏览器,从而得到快速发展。万维网三要素:统一资源识别器URI,超文本传输协议HTTP、超文本标记语言HTML,重要性呈递减排列。“除此之外,就没有什么其他东西了”。(p.36)
对我来说,万维网几乎等同于互联网,除了个人信息管理工具外(如邮件与笔记),其他都喜欢通过浏览器访问。特别不喜欢微信,因为在万维网上可见性太差,除分享链接外均不可见。李爵士应该也不会喜欢微信。

W3C是个什么样的组织?其标准为什么称为“推荐”?不时会看到的RFC(Request for Comments)又是什么意思,比如“1990年代的书目记录格式:RFC1807”(2015-10-17)?
为推广万维网,李爵士在1992年开始参与互联网界的标准制订机构 IETF(Internet Engineering Task Force)的活动。为给URI制订一个标准,折腾数年未果,最后李爵士编写了一份关于URI如何在万维网上使用的规格说明,并作为一种资料性的“1630号评论请求书”向IETF团体散发——按IETF官方说法,RFC是关于因特网的技术和机构注释,包括协议、规程、程序、概念、会议纪要、观点甚至幽默。
成为IETF接受的标准太麻烦,于是李爵士期望筹组另一个机构,即后来的W3C。联合会召开的第一次咨询委员会会议上,“对于联合会应该真正确立一个“标准”还是仅发布一个形式上的“推荐规范”,选择了后者,以表明赢得“大体上的共识和符合现行惯例”正是我们所要运作的水准”。
MIT是W3C后面的支持机构,不是没有原因的:www.mit.edu很早被一个学生计算俱乐部占用,因此1992年建立的MIT主服务器名称只好用 web.mit.edu ——现在还是这样。
W3C中国的介绍:万维网联盟(World Wide Web Consortium,简称W3C)创建于1994年,是Web技术领域最具权威和影响力的国际中立性技术标准机构。万维网联盟由Web的发明者 Tim Berners-Lee及W3C的首席执行官 Jeffrey Jaffe领导,由设立在美国麻省理工大学(MIT)、欧洲数学与信息学研究联盟(ERCIM)、日本庆应大学(Keio University)和中国北京航空航天大学的四个全球总部(W3C Hosts)的全球团队联合运营。——本书中只有3家,当时北航还没有加入。

第12章和第13章“机器和万维网”主要围绕“语义万维网”的设想
李爵士在1980年在CERN做最初的超文本时,就是通过链接输入的:“对于每个链接,必须描述其关系是什么……链接是双向起作用的”。
(第12章,p.154)“我有一个关于万维网的梦想……它由两个部分组成。在第一部分中,万维网变成了一个有利于人们相互合作的强大工具。……在梦想的第二部分,合作延伸到了计算机。机器变得可以分析万维网上的所有数据——包括内容、链接,以及人与计算机之间的交易。能够实现这一切 一种“语义的万维网”(Semantic Web)尚未出现……”。
十多年后,语义万维网开始出现了,或者如鲍捷所说,现在开始加速了。重温一下李爵士当年的设想,也是很不错的感觉。

万维网发展过程中,有一位图书馆员的超前贡献
1991年5月,保罗•孔兹从帕洛阿尔托的斯坦福线性加速器实验室(SLAC)到CERN访问。当他回到SLAC时,他将这个万维网程序与负责管理SLAC所产生的所有资料的图书馆员路易丝•阿迪斯一同分享。她把这个程序看作让SLAC大量在线文档的内部目录向全世界物理学家开放的一种方法。她说服一位为她开发工具的同事编写了合适的程序,而且在她的鼓动下,SLAC建立了第一个CERN以外的万维网服务器。——这是世界上第2个万维网服务器。
那时1990年10月建立的第1个万维网服务器 info.cern.ch 的日访问只有10-100次(此后几年以每年10倍速度增加)。顺便说一下,世界上第1个万维网服务器主页还是当年的样子。

最后引李爵士语录:“总会有一些表示不同意见的人,而他们正是进步的杠杆”。(p.92)