基于粗糙集的连续值属性约简算法研究

来源 :内蒙古大学 | 被引量 : 4次 | 上传用户:kalok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类进入信息化时代,每天的生活工作中,都会产生大量的数据信息,社会活动急需一种处理工具,可以从大量表面看上去杂乱无章、冗余多同时存在数据噪声干扰的大量数据“堆”中删掉没有价值无用的数据,同时获得有用的可以帮助人类做出分析决策的决策规则。粗糙集在处理这方面的问题具有许多优势,因此受到越来越多人的关注并且得到广泛的应用。经典的粗糙集模型是建立在严格的等价关系基础上的等价类划分,所以处理对象只能是离散型数值的决策表。然而现实生活生产工作中产生的大量数据是连续型数值,需要进一步探讨。本文首先给出了贪心算法和基于信息熵的离散化算法,分析了算法的优缺点,在此基础上,重点分析了基于属性重要度的连续数据离散化算法,给出了一个连续型数据决策表用来验证算法。然后给出了直接在决策表中对数据进行处理,提取决策规则以及属性的相对约简的计算方法。此过程中通过设置系统容许误差以及与模糊集结合,计算系统的最大容差类和区分函数,得出决策规则以及相对约简。最后通过具体决策表验证算法的有效性。同时对数据表中存在数据缺失以及数据遗漏的不完备数据表进行了处理,提出了针对连续型决策表的扩展区分矩阵算法,通过矩阵各元素间的逻辑与或运算,得出相对约简和核属性,并用具体决策表验证算法的有效性。最后通过数据填充算法,将不完备数据表转化为完备数据表,提出了基于树结构的约简算法,处理过程浅显易懂,且结果能够得到决策表的所有属性约简。
其他文献
服务价值反映的是顾客对服务优质性的全局评判,其更能体现服务的本质,被视为提升组织核心竞争力的新源泉。但与服务质量、顾客价值等相关概念相比,服务价值研究在深度、广度和系
通过数理统计、典型解剖,结合模拟实验,对济阳坳陷页岩油富集要素进行深入剖析,认为济阳坳陷页岩油富集要素主要包括岩相、可动性、微裂缝和压力,其中富有机质纹层状岩相是页
随着信息技术的迅速发展,电子商务在国民经济和社会信息化中作用也已经日渐突出,并且在供应链中发挥着不可或缺的作用,同时产业集群也已经成为适应全球经济化发展和市场竞争背景下的社会关系型组织,供应链协同在企业的作用也越来越受到关注,尤其是在制造型企业。本文s对电子商务应用、供应链协同以及产业集群的之间的关系进行了实证研究,得到一些研究结论,为企业提供理论依据和路径方法指导,具有显著的实际意义,本文主要从
21世纪,随着网络信息技术的飞速发展,制造业呈现出网络化、虚拟化、智能化和服务化的发展趋势。为了符合这些发展趋势的要求,一种新的制造模式——云制造应运而生。云制造秉承以