论文部分内容阅读
概念格是近年来获得快速发展的数据分析的有力工具之一。它通过Hasse图表现出概念之间的泛化和例化关系,已在知识工程、数据挖掘、信息检索、软件工程和数字图书馆等领域得到广泛的应用。目前的形式概念分析主要基于经典的形式背景来进行的,即形式背景中对象和属性的二元关系的取值为0和1,然而在许多实际问题中对象和属性的二元关系是模糊的、不确定的,是一个模糊集合。模糊集理论能够分析和处理模糊的信息,已成功地应用到许多研究领域。对模糊形式背景的研究更加符合实际需要,具有重要的理论意义和应用价值。
本文的主要工作有:
通过对模糊形式背景的研究,给出了基于阈值的模糊形式背景的概念格的构造方法。即通过设置阈值,将模糊形式背景转化为基于0、1值的经典形式背景,并采用了自底向上的方法构造概念格,构造格的方法是对Chein方法的改进,Chein方法会在底层产生大量的重复结点,并且没有生成Hasse图,而本文在改进后,可在底层避免产生大量的重复结点,并最终生成Hasse图,通过设置不同的阈值,可以得到不同的概念格,进而得到不同精度的知识。
讨论了在已构造好的概念格的基础上进行属性约简的问题。通过Hasse图,采用按层次对图中的每一个概念进行遍历,并对概念中的每一个属性进行判断,看它属于绝对必要属性、相对必要属性还是绝对不必要属性,本文给出了基于概念的属性判定定理;通过属性约简,可以约去大量冗余的属性,更加快速地进行规则提取和知识发现。
本文最后研究了关于形式背景的合成问题。根据它们合并前后的变化,提出了四个类型的概念,不变概念、合并概念、更新概念、新增概念,并对这四个概念做出了说明,最后,给出了形式背景合成的算法。