开班前看到远洋过客的“正确认识本体的功能和局限”系列博文及首篇下热闹的评论,完全不知所云。上完第三门课“实用分类系统的编制与应用”,在秦健老师的指导下用Protege试做了一个最简单的ontology,对第二篇有了点感觉。不过,短短二天半的课程,对ontology只能说连一知半解的程度都没有达到。
什么是ontology?
就像什么是Web 2.0,什么是图书馆2.0,定义五花八门,可谓众说纷纭。
秦老师在课上不同部分举了很多种说法;迷图在前述博文下的评论:“可以查查Google的definition,看看ontology有多少说法。”
ontology可以做什么?
这是最令人困惑的。
为了“学以致用”,在最后报告中用上ontology,看了一堆期刊文章。结果很失望,因为看到的那些概念结构图都是一维树状或带少许网状的,而我想要做的是一个依时间变化的二维交叉结构。那些概念结构图,在我想来用不用ontology这个概念都无所谓的。
所幸查到肖怀志的博士论文,让我觉得ontology真的可以做些事。《基于本体的历史年代知识元应用研究》通过建立三国时期的历史年代本体,由计算机抽取《三国志》中的历史年代,实现相关历史年代信息的检索和聚集。
如何建立ontology?
看了肖博士的学位论文,才让我知道建本体原来超级烦人!并不是画个结构关系图那么简单。一个公元纪年与三国年号纪年对照表(两页纸,4列不到100行),化为ontology,就是数十页纸的篇幅:不但要为每个年号做框架(如“甘露”),还要做出其中的每一年(如“甘露一年”“甘露二年”……);为每个公元纪年做;还有国别、皇帝……(参见第四章”三国时期历史年代本体的建立“)。
看了此文,课上举的那个例子也就可以理解了:
Adam和Beth生了Charlie、Donna和Ellen三个孩子,要描述出其家谱,需要几个框架?如:
Adam
性别:男性
配偶:Beth
孩子:(Charlie, Donna, Ellen)
答案是至少7个:5个人各做1个,另外还有2个?秦老师说,分别是:男性、女性。
什么时候用ontology?
二种情况:当需要共享或者再利用某领域的知识时。
秦老师语:有时候可以用成熟的、传统的、经济的方法,不一定非得用……
远洋过客言:“以推理为目标和按逻辑和公理制作的本体(泛指词)只是可以利用的知识组织系统之一,不应是我们唯一的、也不应是最终的目标和手段。”
不过,看三国纪年、家谱的ontology框架看得让人上火,如果不是为了让机器推理,我才不要做什么ontology呢!一个二维表岂不简单得多?
以上是上完课后,对Ontology的认识,纯属外行胡言乱语,如有误导,概不负责;-)
推荐:远洋过客:
正确认识本体的功能和局限(1)(May 9, 2008 at 4:43am)
正确认识本体的功能和局限(2)– 概念显示实例 (May 9, 2008 at 11:35pm)
正确认识本体的功能和局限(3)– SWAD的例子 (May 11, 2008 at 3:13am)
数图研究笔记:“本体”或“实用分类系统”?(5月 21st, 2008 @ 00:51)
Keven对远洋过客博文的述评。
参见:
中美数图研讨班2008·数字资源长期保存 (2008-05-24)
中美数图研讨班2008·人机交互与数字化图书馆 (2008-05-24)
数字化图书馆应该开源,学习Wiki也是一种好方向
谢谢提及我们那些关于ontologies的讨论,看来我的抛砖引玉法还挺见效的。祝贺你的第一个ontology的诞生。
我想那三国纪年、家谱的做法是做成知识库(knowledge-base)了,增加了instances,都是很具体的在很清楚的界限内的应用(建立在不太会产生歧义的事实上)。
你可以到BioPortal看看那里有很多很好的ontologies,不是以有instances的知识库为成果的,而是以知识领域模型和assertions(段言)为成果的。
OpenCyc 现在已有 300k terms (词条); 14k predicates (谓词); 57k classes(类); 2 million assertions (断言)…。 用户多半是政府军队系统和医疗系统。免费,开放使用,有3万多用户。ResearchCyc (researchcyc.cyc.com) 是 OpenCyc + millions of hand-engineered assertions, 有300多用户。
有些资料见本人4月26日对一期Open Ontologies Repository 会议的介绍 (开放本体仓储(Open Ontology Repository, OOR)会议内容和ppt下载)。希望你到ning参加本体讨论。
谢谢!先保存着。现在还没有参与讨论的能力,只是乱讲一气罢了 😛
哎,俺也一直没有太清楚的是,普通馆员在本体上会用到哪些可亲自实践的内容,也是影响大多数馆员去深入了解或有兴趣探究的原因之一?
我也是瞎猜的,我当时也是看《三国》那个本体图才真正有所了解的,汗ing……
不错,偶想转载