基于多尺度粒化的高效正域属性约简算法研究

来源 :烟台大学 | 被引量 : 0次 | 上传用户:pgzwoaini1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论(rough set theory)于1982年由波兰学者Pawlak教授提出,它是一种高效分析和处理不精确、不确定、不一致信息的软计算方法。属性约简是粗糙集理论的研究热点内容之一,一直受到众多学者的广泛关注。基于启发式的正域约简算法是属性约简经典算法之一,即保证信息系统在约简前后正域不变,从而保持确定性规则不变。由于海量数据的激增,人们对信息时效性的需求变得愈加强烈。现有启发式正域约简算法面临效率低下等问题。因此,众多学者对其进行了大量、深入的研究。启发式属性约简算法的运行效率主要由数据集的对象尺度和属性尺度两个方面影响。在粗糙集理论中,由特定二元关系信息粒化可以得到数据集的一簇信息粒,每个信息粒中的信息为不可分辨的。不仅如此,也可以将具有相同特性的属性看作为一个信息粒。从对象尺度和属性尺度出发,在对约简结果不产生影响的情况下,对信息粒进行收缩(zoom out)或膨胀(zoom in),使得数据集维度减小,算法效率得到提升。本文从多尺度粒化的角度出发,针对对象尺度粒化和属性尺度粒化两个方面对启发式正域约简算法进行优化,分别提出了集值信息系统的快速正域约简算法、一种多尺度属性粒策略的快速正域约简算法和不完备信息系统的快速正域约简算法,主要研究工作如下:(1)针对集值信息系统正域约简算法在大规模数据集下的运行效率低下问题,提出一种基于启发式的集值信息系统快速正域约简算法。通过研究属性和对象在约简过程中对算法运行效率产生的影响,在集值信息系统中引入属性无关性和属性重要度保序性的相关定义,介绍了使得算法运行效率提升的相关定理、快速算法和应用实例。最后,通过实验对提出算法的有效性进行分析和验证。实验结果表明提出算法的运行效率优于原始算法的运行效率。(2)针对启发式正域约简算法在大规模数据集下的运行效率低下问题,提出一种基于多尺度属性粒策略的快速正域约简算法。通过研究属性粒产生正域之间的关系,定义了多尺度属性粒的概念。该方法无需求取核属性集合,每轮迭代将多尺度属性粒加入到候选属性集合中,使得候选属性集合的分类能力趋向于原始特征的分类能力更快,迭代次数减少。算法通过去冗余过程,保证了约简结果的正确性。最后,通过实验对提出算法的运行效率进行比较和分析,实验结果表明提出算法更高效。(3)针对不完备信息系统正域约简算法在大规模数据集下的运行效率低下问题,提出一种基于不完备信息系统的快速正域约简算法。该算法打破传统启发式算法思想,在启发式搜索过程中,通过判断条件属性相对于决策属性产生正域间的关系,向候选属性集合中增加一个或两个属性,使得算法整体迭代次数减少,并且该算法无需求取核属性集合,在每轮迭代过程中删除候选属性集合产生的正域,算法效率得到有效提升。最后,通过和现有高效算法运行时间的对比和分析,实验结果表明提出算法更高效。
其他文献
目的明确丹红注射液(Danhong Injection,DHI)对原代心肌细胞(myocardial cells,MCs)生长的影响,探讨DHI对缺氧/复氧(hypoxia/reoxygenation,H/R)MCs的保护作用,基于细胞凋亡
在目前先进的大涵道比涡扇发动机中,风扇能够提供发动机全部推力的90%左右。在大涵道比的要求下,风扇转子叶片径向尺寸和迎风面积变大,导致吸鸟概率增大。如何在设计过程中研
研究目的:探讨消痤导滞方联合刺络拔罐治疗痰湿瘀滞型痤疮的临床疗效。方法:本研究主要以10-45岁的痤疮患者为实验对象,所选病例为2019年1月-2020年1月黑龙江中医药大学附属
当今社会,癌症已成为全球人们的首要死因。治疗癌症的方法主要有化学疗法和放射疗法,但其具有强的耐药性,毒副作用大,因此我们需要探索更有效且毒副作用小的抗肿瘤药物以及治
目的观察丹参红花(丹红)有效成分(丹参素、原儿茶醛、丹酚酸B、羟基红花黄色素A)配伍对原代培养的乳鼠海马神经元细胞缺氧损伤的保护作用,并初步探讨丹红有效成分配伍对原代
清代是訓詁學發展的鼎盛時期,對《爾雅》一書的研究也不斷深入。江藩的《爾雅小箋》在歷代前人分析《爾雅》的基礎上對《爾雅》作了進一步注解。本文從訓詁學的角度對《爾雅
举办大型活动来增强软实力和提升国家形象一直是许多国家的常见举措。新兴经济体,特别是金砖五国(巴西,俄罗斯,印度,中国和南非)举办大型活动的趋势引起了很多学术兴趣。本文
目的:观察“养血润燥汤”联合“喜辽妥”(多磺酸粘多糖乳膏)治疗慢性湿疹患者的临床疗效。方法:将符合入选标准的126例门诊就诊的慢性湿疹患者,依照就诊先后顺序,随机分为治
二氧化硅包覆的四氧化三铁磁性纳米粒子(Fe3O4@SiO2 MNPs)具有优异的超顺磁性和化学惰性。通过硅烷化反应对Fe3O4@SiO2 MNPs表面进行氨基化修饰后,可进一步利用所修饰氨基的反
多电航空发动机已经成为航空领域热门研究方向之一,电动燃油泵是多电发动机控制系统的关键部件,其性能对发动机控制系统的性能影响极大。本文将对电动燃油泵进行设计并对其燃油计量控制技术进行研究。(1)齿轮泵结构参数设计及流场数值分析。首先根据燃油流量和压力需求,对齿轮泵齿数、模数、齿宽等结构参数进行计算。并设计了斜边卸荷槽来避免困油现象的产生,保证齿轮泵平稳运行。设计自适应端面间隙自动补偿装置来提高容积效