改进的森林优化特征选择算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:liudongjiw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学领域中数据挖掘和机器学习方向上探索和研究的不断推进,面对日益增长的数据集规模,如何在降低计算成本的基础之上仍旧保持优异的算法性能成为至关重要的问题。特征选择,其目标在于合理降低数据集维度,并且使选择的子集拥有不亚于甚至更优于原数据集的算法性能。在分类算法中,为获取更优质的类别区分性能,特征选择采用最本质的方法就是在原特征集合中将无关的及冗余的特征剔除,从庞大的初始特征集中选择出对类别最具表征性的特征,将其加入特征子集。用于特征选择的方式数不胜数,近些年,通过进化计算的方式进行特征选择获得了学术界广泛关注,并且成绩斐然。森林优化算法(Forest Optimization Algorithm,FOA)是模拟自然界的树木播种的方法的进化计算理论。初始用来解决连续型最优问题,而后在机器学习相关领域学者的优化和改良后,森林优化算法演化成为了解决离散化的特征选择问题的FSFOA算法(Feature Select using Forest Optimization Algorithm)。本文在FSFOA算法的基础之上,提出了SFSFOA算法(Strengthen Feature Selection using Forest Optimization Algorithm),该算法主要针对FSFOA算法的不足之处分别提出强化播种,劣质树衰减和优势树杂交三个优化策略,并在低中高三个维度的数据集中分别进行实验,证明SFSFOA算法不仅在准确度方面有进一步的提升,且在维度缩减方面也有可观的改善。特征选择的方法的分类可以根据评估准则进行划分为Filter和Wrapper两种类型,Filter方法的相对于Wrapper方法的优势在于计算复杂度小,计算成本低,处理高维数据效率更高;而Wrapper方法以学习结果为导向,分类性能更高。SFSFOA算法与FSFOA算法同属于Wrapper方法,故而同样存在Wrapper方法计算成本过高的缺点。因此,本文提出了一种WFFSFOA(Wrapper and Filter based on Feature Select using Forest Optimization Algorithm)算法,在SFSFOA的基础之上有效的Filter和Wrapper两类特征选择方法优点进行整合,并进行相关实验,实验结果表明,相对于传统FSFOA算法,WFFSFOA算法既能保证算法准确度,又能显著降低计算成本,提高算法收敛性能。
其他文献
广西本土民族音乐资源丰厚,民族文化保护迫切。广西特色乐器天琴初期保护成绩显著,从现状和长远看,仍面临诸多问题。笔者认为,把天琴纳入广西专业课堂教学,是众望所归、水到渠成的
深圳市空气质量在国内大中城市中属于较好水平,但目前大气细颗粒物(PM2.5)年均浓度还是世界卫生组织(WHO)推荐的空气质量指导值(10μg/m3)的3倍,因此深圳市的空气质量管理工作仍
教师专业成长过程中,实践智慧意义重大。教学模式研究是提升实践智慧的一种有效途径,在不同的阶段意义不尽相同。首先要借鉴学习、熟悉多种教学模式;进而是活用、整合多种模
目的分析2型糖尿病在多药联合治疗中行药学干预的效果。方法选取2017年7月-2018年7月在我院诊治的108例2型糖尿病患者临床资料,按干预方案不同分2组,每组54例,对照组行多药联
四环素类抗生素是由放线菌产生的一类广谱抗生素,包括土霉素(OTC)、金霉素(CTC)、四环素(TC)、半合成衍生物强力霉素(DC)、等,近年来随着抗生素生产和使用量的迅速增长,大量
严寒地区冬季需要供暖来保证室内温度,在封闭的房间为了保持室内空气品质需要通风换气,加热新风需要消耗热量,采用传统的新风/排风热交换装置可以回收部分排风热量,但仍有部
长三角一体化发展示范区作为中国高质量一体化发展的示范区,应积极吸收"成长三角"等国际上较为成熟的区域一体化的发展经验,从构建区域间合作创新体系和培育共识文化入手,注
三棱针挑刺治疗传染性软疣232例,结果1次治愈的214例,占92.2%,2例治愈的18例,占7.8%,提示挑刺法治疗传染性软疣疗效满意。
定语从句是历年来的高考热点,也是高中教学语法的难点和重点之一。人教版教材也用了4个单元学习定语从句,并且用2个单元复习。在高三的一轮二轮复习中,也会谈及定语从句。本
油茶Camellia oleifera C.Abel,属于山茶科(Theaceae),山茶属(Camellia),是南方主要的经济树种之一,近年来,随着政府的大力扶持,油茶产业逐渐发展起来,但是油茶产量由于受到天气,季节和病害,虫害等原因,导致结果率低,产量差,制约着油茶产业的发展。目前对油茶的病害研究多集中细菌病害和真菌病害,对油茶病毒病害的研究较少。为此,本研究采用二代转录组测序的方法,对江西