概念格Chein构造算法的改进

来源 :河南大学 | 被引量 : 0次 | 上传用户:jackmengxiaojing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
形式概念分析作为一种有效的数据分析工具,已经在许多领域得到了广泛的应用,如:机器学习、知识发现、信息检索、软件工程等等。概念格是形式概念分析理论中的核心数据结构,而对概念格的许多应用都要涉及到概念格的构造。概念格的完备性是它的主要优点之一,它使造格的最终的形式是唯一的和可重复的,因此概念格的构造不受数据或属性排列次序和构造方法的影响。但也因此导致概念格的结构庞大。在理论上的最坏的情况下,概念的节点个数会随着形式背景中对象个数和属性个数的增加以指数倍增长。构造概念格需要解决的一个重要问题就是:如何提高构造概念格的效率,降低时间复杂度。概念格的Chein构造算法是以分层的方式自下而上进行构造的,具有构造简单明了,易于生成Hasse图的特点。但是,Chein算法构造概念格的效率较差。Chein算法在生成下一层的过程中,对当前层的所有概念进行相交运算,不但耗费运算时间,而且会在下一层产生大量冗余节点,导致下一层要进行更多的相交运算。因此,使得Chein算法效率较低,而且需要占用大量的存储空间用来存放冗余节点。本文在对目前已有的各种概念格构造算法进行研究的基础上,对Chein算法进行了改进。通过分析概念格的Chein构造算法存在的问题,提出了信息反映度的概念,并以此解释了Chein算法在构造概念格时产生大量冗余节点却不能删除的原因,由此提出了对Chein算法的改进。改进算法的算法思想为:在产生下一层的概念节点之前,先对当前层概念组成进行分析,确定当前层是否存在冗余概念。如果有冗余概念,则将冗余概念根据属性集的蕴含关系,找到相应的非冗余概念划分为一组,在生成下一层概念节点时,只需要将同组的冗余概念和非冗余概念进行相交运算即可,不但减少了生成时间,而且有效避免了冗余节点在下一层的产生;如果当前层没有冗余节点,则对所有非冗余节点进行相交运算,相交次数仍然小于Chein算法。从而在提高概念格构造效率和降低造格时间复杂度的同时,保留了Chein算法结构清晰明了和易于生成Hasse图的优点。实验和算法分析表明,本文提出的模型和算法是有效的,随着形式背景规模的增大,相对于Chein算法的优势也会更加明显。因此,适用于对较大规模的形式背景进行批处理造格。本文的主要工作如下:(1)提出了对Chein算法的改进,用非冗余概念之间的相交运算以及非冗余概念与冗余概念进行相交运算两种方式,代替了Chein算法中对当前层所有概念两两进行相交运算的方式,来生成下一层的概念节点,从而提高了构造概念格的效率。(2)在研究Chein算法的过程中,提出了信息反映度的概念,证明了Chein算法构造概念格在概念信息反映不完全的情况下,不能直接删除冗余概念节点。只有当冗余节点包含的信息在概念格中得到完全反映之后,才能删除冗余概念节点。
其他文献
众所周知,研究离散时间的种群动力学模型不仅具有广泛的生物学意义,还具有重要的实用价值。近年来,国内外许多学者对离散时间种群动力学模型研究得到非常多的成果。   本
图像分割是把图像分成若干个特定的,具有独特性质的区域。是数字图像处理中的一项重要技术,同时它也是图像分析的一项基础和关键过程,多年来一直受到广泛重视,并成为图像处理
对于非光滑优化问题的研究往往是通过对非光滑函数进行光滑化来处理的,未曾考虑函数特有的结构,即函数本身所包含的光滑信息.UV-分解理论是借助于凸函数中的光滑信息得到函数的
多项式环在交换环理论研究中占有重要的地位,素理想和极大理想又是交换环中最重要的两个特殊类型的理想,人们对于多项式环中理想的研究从未间断,并取得了一些研究成果:1981年-198
均匀设计(Uniform Design)是一种只考虑试验点在试验范围内均匀散布的试验设计方法。它由方开泰教授和王元院士在1978年共同提出,是数论方法中的“伪蒙特卡罗方法”的一个应用
在保险公司的运作中,保费收入是主要收入来源,理赔是主要风险因素,为了保障保险公司的正常运作,保险公司必须充分考虑所面临的风险,而破产理论的研究主要是针对保险公司如何估计所
混沌,作为大自然中的一种分布广泛且具有复杂动力学的非线性现象,近年来受到了多个领域的科学家们和工程师们的普遍关注.Lorenz系统——首个混沌数理模型——以及与之相关的类L
图论(Graph Theory)是离散数学最重要的一个分支,它以由若干给定的点和连接两点之间的线构成的图为研究对象,用以描述某些事物之间的联系。而染色问题是图论的重要问题之一。为了
本文讨论了几类椭圆型方程和方程组的解的存在性、多解性、先验估计以及其他相关性质.   在第一章中,介绍研究工作的背景以及本文的主要工作.   在第二章中,主要研究一类
互补问题(CP)是运筹学与计算数学的一个交叉研究领域,在数学规划、博弈论、力学和供应链管理等研究领域有着广泛的应用。R.W.Cottle[12]首次提出了“互补问题”,使得人们开始广