论文部分内容阅读
形式概念分析(Formal Concept Analysis)这一新兴的数据挖掘理论,是由德国学者Wille提出的。形式概念分析的思想主要来源于哲学,在哲学中,概念是由外延和内涵两部分组成的思想单元。而在形式概念分析中,概念的外延被理解为属于这个概念的所有对象的集合,内涵则被认为是所有这些对象所共有的特征集。利用概念和概念间的泛化和例化关系可以构成一个概念格,而与其相应的Hasse图则实现了概念格中概念及概念间层次关系的可视化。目前形式概念分析已被广泛地研究,并应用到机器学习,软件工程和信息获取等领域。本文主要是对基于概念格的形式背景的蕴涵规则提取算法进行了研究,此外,本文对概念格的渐进式构造算法进行了深入的研究,提出了一个高效的算法,所获研究成果不仅从理论上丰富和发展了形式概念分析,而且提升了其在实际应用方面的探讨价值。本文获得了以下主要成果:1.在已有的Godin算法的基础上,详细地分析了概念格的渐进式构造过程,提出了一种新的概念格渐进式构造算法,对典型的渐进式构造算法Godin算法作出了一些改进,通过程序实验验证了算法的有效性。2.讨论了如何通过求出的概念格中各概念的真内涵缩减集得到形式背景的完备的蕴涵规则集,如何再去除其中的冗余蕴涵得到形式背景的完备的无冗余的蕴涵集合,给出了一个从概念格得到完备的无冗余的蕴涵规则集的算法,并通过实验验证了算法的有效性。最后,概括了本文的主要研究结果,指出了有待进一步解决的问题。