Chrome的云打印

Google Chrome 9正式发布,可以设置Google云打印服务:
将打印机与“Google 云打印”相连后,不论您身处何地,都可以通过任意一台计算机或智能手机将打印任务发送到您的打印机进行打印。只需在 Google Chrome 浏览器中激活“Google 云打印连接器”,您即可通过启用了“Google 云打印”的网络和移动程序执行打印(出自:将打印机连至“Google 云打印”。注:该页面下载的Chrome非最新版)。
换言之,现在可以在路上用平板电脑或智能手机按Ctrl-P,然后回家或到办公室取打印件了──不过呢,目前只有移动版Gmail和Google文件支持云打印(via Google Operating System: 9 Things to Try in Google Chrome 9)。相信会有更多应用支持(包括iPad应用)。未来如果用Chrome操作系统的话,就可以随时随地发送打印请求了。
详细的中文介绍见“Google 云打印帮助”(注:该页面的Chrome下载链接非最新版)。使用前先要把打印机设置为云打印机,要求与打印机相联的电脑安装Windows 7/XP/Vista及最新版Google Chorme。设置方法:Chrome的扳手(设置)——选项——高级选项,在最下部的Google Cloud Print,点“登录Google Cloud Print”按钮,在新窗口中输入Google帐户及密码即可。详见“将您的本地打印机与“Google 云打印”相连”。[update 2010-2-10] 但中文帮助页的打印测试按钮无效,需使用如下英文页面:Connect your local printers with Google Cloud Print
很不幸,家中电脑按上述设置完后没识别出打印机。
帮助说:“如果您使用的是 Windows XP,请确保已安装 Microsoft XML 纸张规范软件包(英文版)”。点击链接到Microsoft XML Paper Specification Essentials Pack下载页面,选择XPSEP XP and Server 2003 32 bit.msi (7.5MB)。
一边下载一边浏览该页面,又发现说明:“The Microsoft XPS Document Writer requires Microsoft Core XML Services 6.0 to be installed on your system.”再点击链接到Microsoft Core XML Services (MSXML) 6.0,选择下载msxml6.msi (1.5MB)。
下载完成后依次运行,重启浏览器、打印机,还是不能识别。不知道是否XP版本太旧?
成功的例子见谷奥:未来震撼眼前!Google 云打印已经可以正常使用!(2010年12月7日)
[update 2010-2-7]经sogg提示,关闭Windows防火墙后设置成功。
方法:控制面板──网络连接──本地连接──(右键)属性──高级──Windows防火墙:设置──关闭(详见:Win XP系统网络防火墙配置)。
设置完成后,在其他电脑用Google帐户登录后访问云打印管理界面,也可以看到可用的打印机。
Google cloud printer manage
点击打印测试页,选择打印机,可做打印设置,然后打印即可。
如果点击打印后网页右下角提示登录失效,只要点击重新登录即可。
Google cloud print: Print

Google实验室新品Books Ngram Viewer:数据的可靠性

Google实验室推出新产品Books Ngram Viewer,以图示形式显示/对比查询词在1800-2000年间图书中的词频,包括英、法、德、俄、西、汉六种文字。与Google搜索不同的是,查询词是区分大小写的。作为Google图书的一个副产品,在图示下还有查询词在Google图书搜索的链接,且根据词频,分不同的年段。
《纽约时报》介绍文“五千亿单词、文化新视窗”(In 500 Billion Words, New Window on Culture, December 16, 2010),译言上的报道名“谷歌发布带有 520 万数字化图书数据的全新可视化工具”(2010-12-18)。
基于520万图书、5千亿单词的语料库,如介绍所说,该产品以可视化方式揭示“语言、文学、文化随时间的变迁”,是“供学者们使用的全新量化工具”,的确很强大。然而,由于原始数据本身存在问题,对结果的影响显然是致命的。以如此结果为依据进行分析,其可靠性自然存疑。

其一、元数据问题

随便找两个词“图书”和“图书馆”,图示结果如下:
Google Books Ngram Viewer

可以明显看到“图书馆”一词在1900年前后进入第一个高峰,在1980年前后出现另一个高峰,均高于“图书”的出现频率。这是很有意思的现象。
点击看1800-1906年段有“图书馆”一词的图书──数据(或元数据)错误暴露无遗。前5条没有一条年份是正确的:
√ 第1条:吉林大学 – 1906《全国高等院校社会科学学报 … 总目录》,命中内容“1923 5 图书馆事业之发展夏廷械”等
√ 第2条:广东省民族研究所, 广东省群众文化艺术馆 – 1900《民族民間艺术研究》Volume 2
√ 第3条:吉林省社会科学院, 吉林大学 – 1900《满铁史资料》Volume 4, Part 4,命中内容“1941 ,油印本(关于在日本内地抚顺煤与我国煤的调查门满铁会社(最近抚顺煤旷出煤情况门中国科学院图书馆存……”
√ 第4条:丁丙 – 1900《武林坊巷志》Volume 1,命中内容“为此、我们特将浙江省图书馆所珍藏的原稿,进行加工整理,分为八册出版,为社会主义精神文明建设, ^提供有价值的历史资料。”
√ 第5条:山西省社会科学硏究所 – 1900《山西革命回忆录》Volume 3
除了第1条1906有点奇怪,其他估计是年份不明的都被当作1900年的了。

其二、字符识别问题

Librarything的Tim使用Books Ngram Viewer发现,fuck这个流行骂人话不但历史悠久,而且在1700年前后远比现在流行。
Books Ngram Viewer-fuck
查图书原文,当年的那个词其实是suck。因为早年字母有所谓“长s”,长像就是没有短横的f。而Google图书显然没能识别。
suck not fuck

Via Thing-ology Blog: Romeo and Juliet, with—Get your mind out the gutter! (DECEMBER 17TH, 2010)

———-无语的分割线———-
最近自己一直在为统计伤神。
给不甚准确的原始数据做统计,再……分析,其结果可信度有多少?

TencentTraveler是什么?

    想了解上学期上线的手机网站访问情况,请同事导出服务器日志,去掉搜索引擎机器人记录后进行统计。曾经在上线后不久试做过一次统计,当时标记了搜索引擎机器人的IP段。对照这次的统计结果,发现其中还是有一些机器人的IP,查出其中一个是TencentTraveler,从名称看应该是腾讯的。问同事,同事说查了,是腾讯的浏览器、并非机器人,并发来搜索结果的部分截屏。
    有点疑惑,自己搜索一下,当然用的是Google。前三条都指TencentTraveler为机器人、蜘蛛,首页结果为机器人和浏览器的各五条。随手发了其中两个抱怨TencentTraveler的链接给同事,然后问她是用什么搜索的,答曰百度。于是改用百度搜索,首页全都是“腾讯TT浏览器”,第二页倒数第二个才提到它是蜘蛛。无语了。
    又一个事实说明,用什么搜索引擎不是无所谓的。

    同事说她之所以没用Google,是因为搜索结果出来很慢。这就是我们的杯具。没有碰到过结果出来慢的情况,只有更无语的忽然间无法访问。总而言之,就是用不那么舒服的各种体验,逼着你放弃Google。