云计算

    “云计算”在忽然间已经铺天盖地。

    前二周不在单位上班,其间收到短信、电邮若干,分别要求提供一些工作中的统计数据以及一份撰写中的报告。因为东西都在办公室电脑中,结果可想而知。当时很是后悔,如果将那些内容都用上“云计算”,就可以很潇洒地e-mail过去了。

    早就体会到了“云计算”的便利,虽然只用到一小部分,以Google系列为主:
· Web邮箱:用Gmail,容量够大。收到、发送的内容都在网上,可以随时随地找出来,还可以转发。如果用本机的邮箱,换台电脑就没法了。
· 网摘:目前以Google Reader为网摘工具。以RSS阅读为主要读网方式,去年开始用Google Reader收藏与分享网页。最近Google Reader推出了Note in Reader,不但可以对阅读器收到的内容加注,还可以在阅读器中收藏任何网页,故此用了若干年的网摘工具Furl也逐渐隐退了。
· 网络相册:用Picasa(少许在Flickr上)。换电脑时不必在新旧机器间复制,也不必担心损坏弄丢,还可以有选择地与他人共享。
· 网络记事簿:现在用Google Note。偶而想起什么怕忘了,在上面记上一笔,不论在家、在办公室还是出差途中。过后在任何机器上都可以看到。
· 文件共享:
    自己的一些PPT放在Google文件发布(因为不想再注册了,所以没有使用更专业的Slideshare);
    用Google文件和朋友共享维护一些Excel表、Doc文件;
    部门的工作细则放在维基(Jotspot)上,大家都可以浏览、添加、维护。

    说到这儿,什么是云计算?据说数月前Google提出云计算之说,一时间各大互联网公司都声称自己早已提供云计算。Google黑板报的“云中漫步——迎接云计算时代的到来”有长篇解说,清晰易懂:

    我们可以简单地把整个互联网看成是一片美丽的云彩……所谓“云计算”,就是要以公开的标准和服务为基础,以互联网为中心,提供安全、快速、便捷的数据存储和网络计算服务,让互联网这片“云”成为每一个网民的数据中心和计算中心。
    在云计算的模式中,用户所需的应用程序并不运行在用户的个人电脑、手机等终端设备上,而是运行在互联网上大规模的服务器集群中。用户所处理的数据也并不存储在本地,而是保存在互联网上的数据中心里。提供云计算服务的企业负责管理和维护这些数据中心的正常运转,保证足够强的计算能力和足够大的存储空间可供用户使用。而用户只需要在任何时间、任何地点,用任何可以连接至互联网的终端设备访问这些服务即可。

    对正在或打算从事IT工作的人来说,面向云计算开发去发展是一个方向。而对普通网络用户来说,有了云计算,只要可以上网,无需硬盘之类的存储介质,不必装软件,就可以完成目前需要在电脑桌面完成的工作。
    
只要开机,然后在浏览器中输入URL,一切工作就可以开始了!

中美数图研讨班2008·结业

    今天结业式时,同样参加了二期研讨班的牛排问我,如果以后再办这样的课程是否参加?我的回答是否定的。事实上,此次报名前就很是犹豫。并不是因为自己已经到了不能学吹打的年龄,而是觉得思想负担太重──因为除了老外上课,还要完成一个项目报告并汇报。

    研讨班采用分组学习形式,不幸做了组长,压力太大。项目本是子虚乌有的东西,但完全凭空设想从无开始设计自己感觉过于困难,所以总是希望从现实中找原型。项目由小组成员协作完成,因而需要考虑各人情况确定主题,尽可能使大家都能有所贡献、有所收获。要在三门课程逐次进行中设想好如何结合课程内容(包括还没有上的内容),在课程进行到一半时提交项目计划,在课程全部完成的当晚完成项目汇报Poster,最后完成项目报告(去年要求10-12页纸,今年是12-15页),作为课业评估的依据──凡此种种,让自己觉得完成项目报告及汇报是课程中最重要的部分,课程内容反在其次了。如果是一个学期,这种注重参与、合作、实践的教学方法很有吸引力,可是现在是要求10天内完成(项目报告略迟)!

    好在小组成员同心协力,在课程进行过程中开始准备。一方面,根据秦老师的“数字图书馆项目报告写作要点”,以项目计划为纲,在Google Docs上协作撰写项目报告;另一方面,本组的技术帅哥根据设计计划PS图若干,为项目汇报Poster做了一些准备。前天小组各位做了一下午的Poster,赶在傍晚完成。昨晚22:33,经过一整天的埋头苦干,自己终于整合完成了13页的项目报告(初稿),长舒一口气。结果已经不重要了,完成就好。

    牛排对这样的学习与交流机会很是欣赏,我也觉得很有收获。只是,实在太累了!

推荐:
图情随笔:数字图书馆项目报告写作要点 (2008-5-23 17:28,显然是美国时间!)
    秦健老师对项目最终报告的说明。秦老师很辛苦,23日晚刚到就给大家讲如何做最后的Poster。各组提交的项目简介也是那时才拿到手,24日一早对11个组项目的评语就已经摆在大家的桌上了,还有针对性地写了这个“要点”。

Beefsteak is thinking:第四期中美数字图书馆高级研讨班感受(一)(2008-05-29)
牛排英语一级棒,对数字图书馆的认识又远在本人之上,他的感受更值得一读。期待新的博文出现。

附:第三期研讨班曾有一个博客,现在居然不能访问了,可恶的Donews!

    本次班长在Chinaren上建了一个校友录,挂在中科院研究生院名下。
    比较有意思的是Chinaren的注册过程。看校友录的先决条件是注册(应该有搜狐通行证也行),一串空格让填,其中有一项身份证号,看着很不爽,决定如果一定要,就不注册了,所以留空──结果很顺利地注册完成。同组一位注册时杜撰了一个身份证号,居然说号码不对不让注册,只好填了真实的身份证号。

参见:
中美数图研讨班2008·实用分类系统的编制与应用 (2008-5-30)
中美数图研讨班2008·数字资源长期保存 (2008-05-24)
中美数图研讨班2008·人机交互与数字化图书馆 (2008-05-24)

[update]

图林茶: 静等Poster出场 (2008-5-29) [忙着写报告、写博,还没来得及看RSS]
图情随笔:挂图展:第四期中美数字图书馆研习班学习汇报 (2008-5-31)
Beefsteak is thinking: 第四期中美数字图书馆高级研讨班感受(二)(2008-06-02)
Beefsteak is thinking: 第四期中美数字图书馆高级研讨班感受(三)(2008-06-03)
Beefsteak is thinking: 第四期中美数字图书馆高级研讨班的朋友 (2008-06-03)
Sunfire: 上海行杂记 (2008/6/5)
Beefsteak is thinking: 乌托邦项目的臆想 (2008-6-5)

 

中美数图研讨班2008·实用分类系统的编制与应用

    开班前看到远洋过客的“正确认识本体的功能和局限”系列博文及首篇下热闹的评论,完全不知所云。上完第三门课“实用分类系统的编制与应用”,在秦健老师的指导下用Protege试做了一个最简单的ontology,对第二篇有了点感觉。不过,短短二天半的课程,对ontology只能说连一知半解的程度都没有达到。

什么是ontology?
    就像什么是Web 2.0,什么是图书馆2.0,定义五花八门,可谓众说纷纭。
    秦老师在课上不同部分举了很多种说法;迷图在前述博文下的评论:“可以查查Google的definition,看看ontology有多少说法。”

ontology可以做什么?
    这是最令人困惑的。
    为了“学以致用”,在最后报告中用上ontology,看了一堆期刊文章。结果很失望,因为看到的那些概念结构图都是一维树状或带少许网状的,而我想要做的是一个依时间变化的二维交叉结构。那些概念结构图,在我想来用不用ontology这个概念都无所谓的。
    所幸查到肖怀志的博士论文,让我觉得ontology真的可以做些事。《基于本体的历史年代知识元应用研究》通过建立三国时期的历史年代本体,由计算机抽取《三国志》中的历史年代,实现相关历史年代信息的检索和聚集。

如何建立ontology?
    看了肖博士的学位论文,才让我知道建本体原来超级烦人!并不是画个结构关系图那么简单。一个公元纪年与三国年号纪年对照表(两页纸,4列不到100行),化为ontology,就是数十页纸的篇幅:不但要为每个年号做框架(如“甘露”),还要做出其中的每一年(如“甘露一年”“甘露二年”……);为每个公元纪年做;还有国别、皇帝……(参见第四章”三国时期历史年代本体的建立“)。

    看了此文,课上举的那个例子也就可以理解了:
    Adam和Beth生了Charlie、Donna和Ellen三个孩子,要描述出其家谱,需要几个框架?如:
Adam
性别:男性
配偶:Beth
孩子:(Charlie, Donna, Ellen)
    答案是至少7个:5个人各做1个,另外还有2个?秦老师说,分别是:男性、女性。

什么时候用ontology?
    二种情况:当需要共享或者再利用某领域的知识时。
    秦老师语:有时候可以用成熟的、传统的、经济的方法,不一定非得用……

    远洋过客言:“以推理为目标和按逻辑和公理制作的本体(泛指词)只是可以利用的知识组织系统之一,不应是我们唯一的、也不应是最终的目标和手段。”
    不过,看三国纪年、家谱的ontology框架看得让人上火,如果不是为了让机器推理,我才不要做什么ontology呢!一个二维表岂不简单得多?

    以上是上完课后,对Ontology的认识,纯属外行胡言乱语,如有误导,概不负责;-)

推荐:远洋过客:
正确认识本体的功能和局限(1)(May 9, 2008 at 4:43am)
正确认识本体的功能和局限(2)– 概念显示实例 (May 9, 2008 at 11:35pm)
正确认识本体的功能和局限(3)– SWAD的例子 (May 11, 2008 at 3:13am)

数图研究笔记:“本体”或“实用分类系统”?(5月 21st, 2008 @ 00:51)
Keven对远洋过客博文的述评。

参见:
中美数图研讨班2008·数字资源长期保存 (2008-05-24)
中美数图研讨班2008·人机交互与数字化图书馆 (2008-05-24)