永远不要相信公司会做图书馆的活

远洋老师在书社会推介博文“永远不要信任公司取代图书馆”,称谷歌购买的档案、扫描图书等创举都基本停滞了。
博文前半部分汇总了Google十五年来在保存历史方面的进退,看后特别有感触。想当年曾经是Google的超级粉丝,玩过早期Google实验室的大部分实验品。这些年来,看着Google一步步变得更商业、不断地关闭好功能好服务,除了无奈还是无奈。至今耿耿于怀的是Google Reader,先关闭分享功能导致使用体验下降,然后又因用户不足而关闭服务——而这是在把其他RSS阅读器打败后所为,显得尤其可恶,以至现在找不到理想RSS阅读替代品。
现摘译博文前半部分,可供了解Google的前十年和后五年。
Never trust a corporation to do a library’s job / by Andy Baio (Jan 29, 2015)

———-永远不要相信公司会做图书馆的活———-
1999年,Google在成立一年后写下其使命声明,为公司接下来十年定下方向:
谷歌的使命是组织全世界的信息并使之广泛可获取与使用。
多年来,Google的使命包括保存过去。
2001年,Google做的首次收购是Deja档,把这个最大的Usenet档重新发布为Google Groups,增补早至1981年的存档信息。
2004年,Google Books标志着该公司意图扫描每本已知图书,与图书馆合作,并开发其自己的图书扫描仪,每小时可数字化1千页。
2006年,Google News Archive发布,有早到200年前的历史新闻文章。2008年,扩展至自己做数字化,扫描从未上网的报纸。
最近五年,始于约2010年,Google管理的重点转移,这些档案项目处于不稳定状态,或完全被抛弃。
在一系列重新设计之后, Google Groups实际上对研究目的而言已经死去。档案虽然仍在线,但已没有途径按日期查询。
Google News Archives死了,于2011年被消灭,现在把检索者定向到使用Google。
Google Books仍在线,但近年扫描工作缩减了,或许受阻于仍在上诉中的十年法律纠纷。官方博客2012年停止更新,推特帐号自2013年2月起休眠。
甚至其旗舰产品Google Search也停止了对web历史的关注。2011年,Google移除了让用户根据日期过滤搜索结果的时间线视图(Timeline),同时一系列对其搜索排序算法的重要更改,更偏向资源新的而非旧的页面。
两个月前,Larry Page宣称该公司超越其14年旧使命声明,其雄心已增长,其优先级已变化。
2015年,Google关注现在和未来:其社会和移动工作,实验机器人和人工智能,无人驾驶车辆和光纤。
事实证明,组织全世界的信息并不总是有利可图。作为公益保存过去的计划确实不是大的利益中心。旧Google知道,但似乎不在意。
保存过去的愿望和20%时间[员工每周可有1天时间做个人感兴趣的其他项目,2013年时已不复存在]、Google Labs[2011年关闭]以及偶然实验精神一同死去了
—–
P.S. 此文副标题是“当谷歌放弃其过去,互联网档案人介入保存我们的集体记忆”(As Google abandons its past, Internet archivists step in to save our collective memory)。文章后半部分是推介Internet Archive,介绍了非营利组织IA的工作及其旗下保存的资源,以前只知道Open Library和Wayback Machine,看介绍还有音视频甚至软件等,值得了解。

Google Reader关闭,RSS阅读仍要继续

Google Reader终于要关了。风声已久,知道这是迟早的事,但看到GR将于7月1日关闭的消息,心理上还是难以接受。不过我不会去请愿,该走的,是留不住的。

看自己当年博文,应该是和写博差不多同步,2004年开始RSS阅读的我试用过的几种RSS阅读方式,2005年2月4日;我理想中的RSS阅读方式,2005年2月14日)。
2005年时,经历了在线RSS阅读器toPim的忽然人间蒸发(一无所有,2005年8月31日)——如果不是GR即将关门,想到查下前GR的情况,我都想不起这个名字了。
2006年时在用Bloglines,到2007年时已经和大多数人一样,转到Google Reader(珍爱生命 远离RSS,2008年4月1日),于是在2008年时,Bloglines就奄奄一息了(Bloglines即将停止服务,2008-10-20)。

用GR已有6年,一年中的大多数日子,GR都是必看的,至今如此。没有统计过每天在上面花多少时间,但几乎每晚的大部分时间,都是在GR上花掉的——多少需要翻墙的内容,可以经由GR直接看到。如果没有GR,博文的信息来源就会少掉一大半,博客也就可以停掉了。
虽然2011年,GR取消了分享功能,虽然近年GR时常不稳定,但为了其不可替代性,还是忍受过来了。

在GR里订有一千多个RSS源,有很多是早已不更新的(包括换了新网址的),为了保存那份记忆,一直没有删除。错以为放在Google上的都是可以长期保存的——之前Google Notebook关闭,内容都自动转到了Google Doc。但这次,只能导出了。

昨天用Google Takeout导出自己的GR内容,很顺利的样子,可惜到了Download步骤,却须翻墙。今天下载到本地,解压后是如下8个文件,35.7MB,这就是我6年的RSS阅读记录?
followers.json 当年有分享功能时自己追随的人
following.json 当年有分享功能时的粉丝
liked.json 自己标为喜欢的
notes.json 当年有分享功能时加的说明
shared.json 自己分享的
shared-by-followers.json 追随者的分享(2011年阉割掉的最有价值内容)
starred.json 自己加星标的
subscriptions (XML) 订阅的RSS源
除了最后一个,都是JSON格式的,还需要找个阅读或转换软件,才能正常阅读。

RSS阅读的好处,真是只有用上手才能体会,无法通过别人的解释领会。
期望以后可以找到替代产品,导入RSS源继续订阅。
目前似乎愿意接手的不少,但是,所有需要逐个加入RSS源的都不会是合格的替代品。
据说Feedly表示会提供无缝转移方案,那就等着吧,还有3个月时间。
希望以后访问可以顺利些。不过在天朝,还真不好说——但愿不是乌鸦嘴。

参考:
新浪科技:谷歌7月1日关闭RSS订阅服务Google Reader (2013-3-14)
月光博客:谷歌宣布关闭RSS阅读器Google Reader (2013-3-14)
电脑玩物:Google Reader 將停止服務,最佳替代方案就是 Feedly (2013-3-14)(有墙)
图有其表:Google Reader最具历史性的一天都发生了什么? (2013-3-15)

Google学术计量──Google期刊排名发布

Google学术计量(Google Scholar Metrics)据说是今年4月1日发布的,列在Google学术页面,应该不是愚人节玩笑。这是自Google去年末推出针对个人的Google学术引用后,Google进入引文分析领域的又一个重要标志。

按其说明,Google学术计量的主要指标针对出版物(期刊)h指数:
h指数:出版物至少有h篇文章每篇被引至少h次;
h核心:出版物最高被引的h篇文章;
h中值:h核心文章被引量的中值。
Google仅计算出版物最近5年内发表文章的上述值,即h5指数、h5核心和h5中值。

目前在Google学术的检索结果页面看不出信息的呈现,也不清楚出版物h指数是否会影响检索结果的排序,或者提供某种限定检索条件。但Google给出了英、汉、萄、德、西、法、韩、日、荷、意10种语言期刊h指数前100的排名,h中值用于相同h指数期刊的辅助排序。目前的排名依据是2007-2011发表文章(五年整),被引数据以2012.4.1为准。
点击各期刊的h5指数链接,可以看到h5核心,即哪些文章对期刊进入排名有贡献,并有文章被引次数及发表年份。
从各语种h指数看,英语排名第1的是Nature,h5指数295,排名100的h5指数也有88,高于所有其他语种排名第1的h5指数。有些语种因h5太低,都没列满100种。中文h5指数仅次于英语,最高的是《经济研究》46。
有意思的是,中文Top 100中有8种图情期刊,作为一个小学科,比例不低:
排名 刊名 h5指数 h5中值
37. 中国图书馆学报 23 34
38. 大学图书馆学报 23 31
44. 图书情报工作 22 28
59. 图书馆论坛 21 27
68. 图书与情报 20 29
80. 图书馆建设 20 24
85. 图书馆 20 23
98. 图书馆杂志 19 26

via [IFLA-L] Google Starts Ranking Journals / McKiernan, Gerard

参见:Google学术引用初探 (2011年11月19日)