论文部分内容阅读
随着Internet技术的日益普及,“丰富的数据与贫乏的知识”问题变得日渐突出,而知识发现正是研究如何从大量的数据中智能地、自动地抽取出有价值的知识和信息,因而成为当前人工智能中非常活跃的研究领域。概念格是近年来获得飞速发展的数据分析的有力工具,用来发现数据中隐藏的知识模式。因此,研究概念格的基本理论以及将其应用于知识发现有着非常重要的意义。 本文主要研究概念格的基本理论和基于概念格的知识发现。 在概念格与粗糙集的关系方面,由于概念格与粗糙集在数据分析方面有相似之处,并且粗糙集的一些概念包括等价类,上、下近似等都可以通过概念格来表示。本文论述了概念格与粗糙集之间的联系,建立了它们之间的的关系。 在概念格的代数性质方面,本文给出了形式背景下概念集合上的元素之间的二元运算,使通常意义下的概念格成为带有算子的概念格,证明了概念格为代数意义下的格,并研究了其代数性质,为概念格的进一步研究提供了理论基础和新的研究方法。 在基于概念格的规则提取方面,知识发现尤其是规则挖掘可以看作是一个形成概念的过程和发现概念之间关系的过程。本文基于概念格理论和闭项集的概念,提出了一种新的更有利于规则提取的格结构,给出了相应的基于闭标记的渐进式构造算法和规则提取算法。最后提供给用户的是直观的、易理解的规则子集,用户可以有选择的从中推导出其它的规则。 本文对概念格本身及其应用进行了一些研究,但是,知识发现正处于发展阶段,概念格理论在知识发现中的应用还有许多问题值得研究。本文的研究工作是一个尝试,相关工作还有待进一步深入。