论文部分内容阅读
数据挖掘(Data Mining,DM)技术一直是计算机工程领域的研究热点。由于该领域知识的不断扩充和更新,我们在使用数据挖掘过程中也遇到了一些问题。比如:1、对于新出现的领域知识,无法实现知识自动定义及归类,而需要领域专家的人工操作,造成定义及归类的人为差异等。2、没有一个统一的数据挖掘领域知识管理系统用于用户的知识检索。3、当一个不具备很多领域知识的普通用户提交一个数据挖掘任务时,可能得不到解决该挖掘任务的挖掘方法及算法的最佳组合。为了解决以上问题,协助用户进行数据挖掘工作,对数据挖掘领域知识进行智能型管理是必要的,因此本文将本体(Ontology)理论引入到数据挖掘领域知识管理中。本文主要所做的工作如下:1、分析了数据挖掘使用过程中存在的问题,指出现有数据挖掘知识管理中存在的不足,并总结了四个主要问题,在此基础上引入本体理论,分析本体功能及引入的优点。2、提出了应用本体论构建了一个开放的、可扩充的数据挖掘知识管理系统架构,并对架构的各个组件及系统的工作流程进行了阐述。3、重点对数据挖掘领域知识本体模型进行阐述,其中包括本体概念,如:数据挖掘任务、方法及算法;本体实例,如:关联规则挖掘、分类挖掘及聚类挖掘中常用算法(Apriori算法、ID3算法、BIRCH算法)实例;本体关系。利用本体建模工具Protégé对知识本体进行建模。研究了使用PAL语言来实现知识概念的简单推理和利用OWL提供的公理进行简单的推理。4、对数据挖掘知识管理系统进行了实验实现,重点实现DM知识查询和DM任务的智能匹配两个功能。5、最后,在总结全文的基础上,提出了若干有待深入研究和探讨的问题。本文最主要的创新点就是提出了应用本体论来构建数据挖掘知识管理系统,并构建了实验系统。实验表明:基于本体论的数据挖掘知识表示方法,能够很好的实现数据挖掘领域知识的语义信息的表示。查询机制具有一定的智能性,可以为数据挖掘知识的智能检索提供有效的支持。实验从而验证了提出的系统架构实际应用的可行性。