基于粗糙集和神经网络的不完备信息系统数据挖掘研究

来源 :云南师范大学 | 被引量 : 0次 | 上传用户:leki55
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际问题中,由于种种原因,数据库中的数据很少是完全的,在数据挖掘中,待处理的数据常有某种程度的不完备.不完备的信息系统普遍存在,如果直接对其使用针对完备信息系统的数据挖掘方法,往往是不合理的,甚至可能会严重影响到挖掘的效果.造成信息不完备的原因是多样的,现实情况下,有些数据受客观条件限制无法观测到,或在数据录入过程受人为的因素影响导致数据缺失,或由于存储介质的故障、传输媒体的故障导致数据缺失,或数据被隐藏等等.粗糙集(Rough Set)理论是由波兰华沙理工大学Pawlak教授于20世纪80年代初提出的,是一种研究不完整、不确定知识和数据的表达、学习、归纳的理论方法.神经网络则有较强的学习能力,可根据一定的学习算法自动地从训练实例中学习并得到规则.该研究将粗糙集理论与神经网络方法相结合,使两种方法优势互补.首先基于粗糙集理论对不完备系统进行完备化,然后对完备化后信息系统使用神经网络方法进行数据挖掘.在完备化处理中,我们提出了改进的ROUSTIDA算法,该方法考虑到不完备信息系统中的遗失数据值的填补,应该尽可能反映此信息系统的基本特征以及隐含的内在规律,故以基于粗糙集理论的可辨识矩阵作为算法的基础,对原有ROUSTIDA算法的适用范围进行扩充,从而使得这种完备化更合理、有效.进而我们提出并建立了将信息系统对象的条件属性对其决策的影响程度进行量化、根据对一致性影响的程度来找出与有缺失属性的对象一致性最好的对象的一致性表征填充方法.最后运用神经网络的方法对完备化后信息系统进行学习和仿真实现验证.实验表明,我们的完备化方法是合理和有效的.
其他文献
  作为一种简捷有力的工具,原子分解方法在调和分析和鞅论中有着重要应用,它不仅可以将单指标与多指标情形一并处理,而且可以提供通常情形难以处理的问题的答案.其基本思想是
KAM理论证明了近可积Hamilton系统多数轨道的动力学稳定性。应用KAM理论于两个自由度的自治系统或一个自由度的时间周期系统,可保证所有轨道都是稳定(沿着轨道作用量不会发生太
  设n为任意的正整数.本文研究了矩阵方程X+A*X-nA=I的正定解.全文包含两个部分.  第一部分:首先研究了函数f(x)=xn(1-x)在区间[0,1]上的单调性,以及极大值和极小值.然后根
JPEG2000是一个全新的图像压缩标准,除了优越的压缩性能外,它还支持很多重要的功能,比如支持无损压缩和有损压缩两种编码模式、嵌入式的码流、多样伸缩性、感兴趣区域(RegionofI
诗歌蕴含了中国传统文化的精华,体现了汉语言文学的博大精深.作为一种高度集中反映社会生活的文学样式,通过丰富多彩的内容、含蓄凝练的语言、琅琅上口的表述,发展成为我国文
非线性波动方程是描述自然现象最基本原理的重要数学模型之一,其精确行波解求解和定性行为的研究,有助于探索和掌握系统运动变化的规律,同时也为求解非线性偏微分方程和研究其动
  自70年代后期以来,混沌系统的研究成为科学界热点问题之一,受到数学、物理、力学科研工作者的广泛重视。由于混沌的显著特征是对初值的极其敏感性和长时间的不可预测性,因而
  Riemann边值问题的研究大多限于正则型Riemann边值问题,封闭曲线上非正则型Riemann边值问题的研究最早始于F.D.Gakhov的著作[1],在其问题的解法中为了引入一些Hermite插值
本文推导了二维矩形域上的正交多分辨分析与多尺度空间,构造了相应的尺度函数和小波函数,以及它们的对偶函数,阐述了利用矩形域上的双正交小波压缩分割图像的原理,并给出了计
本文以构建并行机群系统和实现在机群系统下的并行GMRES(m)算法和并行程序为目的。在对国内外研究现状进行深入分析的基础上,对并行边界元法中的相关环节进行了研究。 首先