基于粗糙集的启发式属性约简算法研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:ceylong2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的发展和普及,数据信息急剧增长,为了获取有用信息,传统数据挖掘技术也在不断改变,其中,基于粗糙集的处理不确定性问题的方法,将粗糙集应用到数据挖掘中,由于其自身独特的优点,即在对数据的处理过程中不需要任何集合外信息,这在一定程度上保证了对问题描述和处理的客观性,从而逐渐成为一种主流方法。属性约简作为其核心内容,实质是剔除知识库中某些不相关或不重要的冗余属性,使经过约简处理后的知识库中的数据量维度得以大幅降低,为后续的分类或规则的提取工作提供便利,同时还要保持原知识库的分类能力或决策能力不变。人们往往希望能够尽可能多的从信息表中删除那些不相关或不重要的属性,从而得到最小约简。但是,目前尚不存在一种非常有效的方法得到最小约简,因此,粗糙集理论的热点和难点就是寻求快速有效的约简算法及最小约简,这具有极大的理论价值和现实意义。本文通过对粗糙集理论和经典属性约简算法的深入分析研究,在此基础上提出了两方面的主要工作内容:首先,为了在决策表中获得更好的属性约简组合,从信息论角度分析,在基于区分矩阵的基础上,提出了一种改进的以条件熵作启发信息的约简算法。该算法将条件属性相对于决策属性的条件熵以及属性值的分布情况同时加以考虑。然后用它们的比作为启发因子,重新给出了一种度量属性重要性的依据,并最终得到属性约简集。通过实验证明,该算法能够有效约简属性集,并且使大多数约简结果获得最简决策规则组合。其次,针对不完备决策表,本文结合冲突域的概念,首先根据冲突域中对象数目的变化情况快速求出核属性,然后根据核属性的生成情况有针对性的进行不同思路的约简,如果存在核属性则进行反向验证,判断该核属性是否就是最终的约简结果,反之,则通过以冲突域中的对象个数作为属性重要性判定条件的约简算法,求出最终约简。根据对两种情况的同时考虑设计了一个高效的约简,并证明算法切实可行。
其他文献
移动对象以一定的数据模型存储于移动对象数据库中;为了满足多种应用需求,移动对象数据库中通常集成多种数据模型,但这种方法带来了异构数据的访问问题。XML的特点很好地适应
魔力平台作为一个商业系统的建模系统,采用零编码、参数化、图形式的模型定制方式,摆脱了繁重的代码编写工作,能够有效地保证软件的质量,降低软件开发的成本,提高软件的开发
当今多种无线通信技术争相发展,其中一种比较新的无线网络技术——无线Mesh网络正在逐渐走入人们的视线。无线Mesh网络具有动态自组织、自配置、自愈性等诸多特点,能够加快部
为提高地铁在站运行效率,本文探讨了一种用反向学习人工免疫算法优化地铁站内运行的方法。   本文优化的对象是站内运行的相邻列车,即前行列车和后行列车。站内运行过程包括
孪生支持向量机(Twin Support Vector Machines,TWSVM)是在2007年提出的,在形式上类似于经典的支持向量机(Support Vector Machines,SVM),时间消耗上却缩减到了SVM的1/4。它
目前,工作流技术在电子商务和电子政务中得到越来越多的应用。工作流技术是实现企业业务过程的建模、仿真分析、优化与管理的核心技术。实施工作流管理技术对于促进我国企事
工业生产中,受到运行时间和所处环境的影响,生产系统的状态不断劣化,工作效率和性能都逐渐下降。当下降到无法满足工作要求时,即使系统还能工作,仍将其视为失效,系统失效会造成经济上的巨大损失。事前维修是指利用一种或一系列的维修作业,发现或排除某一隐蔽或潜在故障,使系统保持在良好的工作状态,避免系统失效,这对于减少生产成本以及工业生产有着重要的影响。因此,如何对生产系统的维修进行调配,避免系统在一个生产成
联机考试系统是考核学生知识掌握程度特别是实践能力的工具,具有广泛的应用前景,由于其联机考核的特殊性,以及实践性题目的自动评阅等问题,成为计算机应用领域研究的一个重要方面
由于Linux日益的普及,在Linux系统下的恶意软件逐渐增长,特别是作为一个桌面操作系统时。其中Rootkit是计算机中最隐秘的恶意攻击技术,它对计算机构成了重大的安全威胁。它通
本文主要围绕物流管理监控系统的设计应用而展开,主要研究了GPSONE技术、GIS地理信息系统、CDMA移动通信、嵌入式终端设备等多个相关内容。然后,根据我国的物流企业的需求,设