中美数图研讨班2008·实用分类系统的编制与应用

    开班前看到远洋过客的“正确认识本体的功能和局限”系列博文及首篇下热闹的评论,完全不知所云。上完第三门课“实用分类系统的编制与应用”,在秦健老师的指导下用Protege试做了一个最简单的ontology,对第二篇有了点感觉。不过,短短二天半的课程,对ontology只能说连一知半解的程度都没有达到。

什么是ontology?
    就像什么是Web 2.0,什么是图书馆2.0,定义五花八门,可谓众说纷纭。
    秦老师在课上不同部分举了很多种说法;迷图在前述博文下的评论:“可以查查Google的definition,看看ontology有多少说法。”

ontology可以做什么?
    这是最令人困惑的。
    为了“学以致用”,在最后报告中用上ontology,看了一堆期刊文章。结果很失望,因为看到的那些概念结构图都是一维树状或带少许网状的,而我想要做的是一个依时间变化的二维交叉结构。那些概念结构图,在我想来用不用ontology这个概念都无所谓的。
    所幸查到肖怀志的博士论文,让我觉得ontology真的可以做些事。《基于本体的历史年代知识元应用研究》通过建立三国时期的历史年代本体,由计算机抽取《三国志》中的历史年代,实现相关历史年代信息的检索和聚集。

如何建立ontology?
    看了肖博士的学位论文,才让我知道建本体原来超级烦人!并不是画个结构关系图那么简单。一个公元纪年与三国年号纪年对照表(两页纸,4列不到100行),化为ontology,就是数十页纸的篇幅:不但要为每个年号做框架(如“甘露”),还要做出其中的每一年(如“甘露一年”“甘露二年”……);为每个公元纪年做;还有国别、皇帝……(参见第四章”三国时期历史年代本体的建立“)。

    看了此文,课上举的那个例子也就可以理解了:
    Adam和Beth生了Charlie、Donna和Ellen三个孩子,要描述出其家谱,需要几个框架?如:
Adam
性别:男性
配偶:Beth
孩子:(Charlie, Donna, Ellen)
    答案是至少7个:5个人各做1个,另外还有2个?秦老师说,分别是:男性、女性。

什么时候用ontology?
    二种情况:当需要共享或者再利用某领域的知识时。
    秦老师语:有时候可以用成熟的、传统的、经济的方法,不一定非得用……

    远洋过客言:“以推理为目标和按逻辑和公理制作的本体(泛指词)只是可以利用的知识组织系统之一,不应是我们唯一的、也不应是最终的目标和手段。”
    不过,看三国纪年、家谱的ontology框架看得让人上火,如果不是为了让机器推理,我才不要做什么ontology呢!一个二维表岂不简单得多?

    以上是上完课后,对Ontology的认识,纯属外行胡言乱语,如有误导,概不负责;-)

推荐:远洋过客:
正确认识本体的功能和局限(1)(May 9, 2008 at 4:43am)
正确认识本体的功能和局限(2)– 概念显示实例 (May 9, 2008 at 11:35pm)
正确认识本体的功能和局限(3)– SWAD的例子 (May 11, 2008 at 3:13am)

数图研究笔记:“本体”或“实用分类系统”?(5月 21st, 2008 @ 00:51)
Keven对远洋过客博文的述评。

参见:
中美数图研讨班2008·数字资源长期保存 (2008-05-24)
中美数图研讨班2008·人机交互与数字化图书馆 (2008-05-24)