论文部分内容阅读
形式概念分析理论是一种基于哲学思想的数学方法,而概念的计算和形式背景的表示又是形式概念分析中重要的研究内容和研究热点。形式背景和形式概念在知识发现,数据挖掘,机器学习,模式识别和信息处理等领域均发挥了重要作用。本文系统的阐述了形式概念分析的基本理论,并以这些基本理论为支撑,主要进行以下的研究:首先,对形式背景进行预处理。将形式背景中的一些冗余对象和属性进行约简和合并,达到简化背景和运算过程的目的。在净化背景的基础上进行属性的分类,并提出了形式背景的属性拓扑表示法。属性拓扑基于图的理论,利用邻接矩阵和关联矩阵进行存储和表示,使得形式背景可视化,并可用于概念计算。然后基于属性拓扑进行了概念计算算法的分析。根据属性拓扑顶层属性的性质,本文提出以顶层属性为中心,将属性拓扑分解为若干子拓扑,并依据子拓扑中属性对象关系进行简单的交集和并集运算,最终得到全部概念的算法。但该方法不但运算复杂,而且条理性较差,因此又提出了基于子拓扑计算概念的改进算法,利用图的搜索理论,减小了运算量,并且运算过程中避免了伪概念产生。进一步研究发现,子拓扑的分解也要占用复杂度,因此又提出通过对原拓扑进行全路径搜索来计算概念的算法。由于不需要子拓扑分解过程,因此实现了概念计算过程的简化,而且得到的概念不重不漏,同时又避免了伪概念的产生,做到了算法的优化。最后,由于计算之前背景经过了预处理,而概念需要对应原始背景下的数据,因此需要进行原始背景的复原,将预处理过程删除的属性对象对应的加回到概念中,从而得到原始背景下的概念。本文的方法不但做到背景表示和概念计算的结合,并且实现了计算过程的可视化,为形式概念分析理论提供了全新的思路。