论文部分内容阅读
在过去的数十年中,我们产生和收集数据的能力已经迅速提高。此外,作为全球信息系统的万维网的流行,已经将我们淹没在数据和信息的汪洋大海中,并且迫切需要将这些数据转换成有用的信息和知识。数据库知识发现是从大量数据中提取有效的、新颖的、有潜在作用的、可信的、并能最终被人理解的模式的处理过程。概念格是近年来获得飞速发展的数据分析的有利工具,用来发现数据中隐藏的知识模式。因此,研究概念格的基本理论以及将其应用于知识发现有着非常重要的意义。本文在以下几方面做了深入的研究并且取得了创新性的成果。
(1)生成概念和概念格是形式概念分析中的必要工作,本文列举了一些经典的渐进式概念格生成算法,包括基于对象和基于属性的算法。最后作者提出了一种新的基于属性的渐进式递归算法,并用实验证明了该算法的高效性。
(2)发现频繁项集是数据挖掘中最重要的工作之一,本文在介绍了几种挖掘策略后,作者提出一种基于属性分组的频繁项集挖掘算法,其挖掘策略与前两种有所不同,与Apriori算法的实验比较说明该算法对于大型数据库是非常有效的。
(3)一个形式背景中形式概念的个数是随背景的大小而指数级增长的,因而背景稍大概念的数目就非常多。对他们的处理、存储及传输就十分困难。本文提出了一种全新的基于粒计算的概念格分解与合成的方法。
(4)Rough集理论与形式概念分析的结合是当今十分热门的话题,本文将介绍用FCA来解决Rough集理论中的一个核心问题—属性值约简的方法。另外,文中还给出了利用上下箭头关系约简形式背景的方法,以便能够快速的构造概念格。