基于进化计算的复杂分类算法研究及应用

来源 :天津大学 | 被引量 : 0次 | 上传用户:lcl427hjc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息技术的飞速发展,人们积累的数据急剧增长。数据挖掘提供了从大型数据库中自动抽取潜在的有用信息的方法。进化计算作为一种新的智能优化技术,已广泛运用于数据挖掘任务中。本论文针对数据挖掘中的复杂分类任务,应用混合进化、多目标进化以及遗传规划技术,对分类规则学习、遗传规划分类和特征选择问题进行了深入系统的研究。主要研究内容和创新性工作包括:(1)介绍了数据挖掘技术的主要方法和研究热点,评述了分类任务中的主要问题和研究进展,概括了进化计算理论基础、整体框架以及最新研究进展。(2)提出了基于混合进化算法的模糊分类器学习算法。该算法采用全新的小生境技术保持种群的多样性,通过单次运行进化算法获得模糊分类器所需的所有规则;此外,算法针对进化算法较弱的局部优化能力,使用了一种模糊规则局部搜索方法,能有效的提高模糊规则的适应值。实验表明,局部搜索方法在进化过程中能够有效的提高整个种群的适应值,算法能获得低复杂度、高预测精度的模糊分类器。(3)提出了基于遗传规划的判别分类算法。基于遗传规划的分类算法能够很好的处理两分类问题,然而在处理多分类问题时具有一定的局限性。针对多分类任务,提出了一种新的遗传规划分类模型——判别分类模型;新模型以最小化误差平方为优化目标,能够产生高预测精度的分类器。为了进一步提高预测精度,还提出了判别分类模型的集成算法。实验结果表明,判别分类模型具有较强的样本分类能力,集成算法能进一步有效的提高模型的预测精度。(4)提出了基于多目标进化计算的特征选择算法。在特征选择任务中,需要考虑两个重要因素:特征相关度与特征冗余度。在分析了基于互信息的启发式特征选择算法的基础上,提出了一种新的特征冗余度计算方法,采用与类别相关的互信息评价特征子集的内部冗余信息;然后使用多目标进化算法完成特征子集相关度最大化与冗余度最小化的优化任务。实验结果表明,将新冗余度应用于启发式特征选择算法中,能够提高被选特征子集的质量;而多目标进化算法能够克服传统启发式算法的局限,获得判别能力更强的特征子集。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
针对应用型卓越工程师的培养标准和知识能力的具体要求,结合工程教育专业认证,强调三个核心理念:成果导向、学生为中心、持续改进。结合实际生产环境,以具体工程环境问题为驱动,探
本文结合重庆市实施“一小时经济圈”战略,深刻分析“一小时经济圈”战略对温泉旅游业发展提供的新机遇,并提出重庆“一小时经济圈”战略下的温泉旅游开发策略。
刘洪洋,1963年生于天津,中国书法家协会篆刻专业委员会委员、培训中心教授、工作室导师,中国艺术研究院中国篆刻院研究员、导师,中国楷书艺术研究院副院长,中国书法家协会“薪传翰
急性冠状动脉综合征(acute coronary syndrome,ACS) 是临床常见的危重急症之一,也是导致死亡的最常见原因之一,包括不稳定型心绞痛(UAP)、非ST段抬高型心肌梗死(NSTEMI)、ST段抬高
采用不主动排泥的运行模式,在相同污泥负荷条件下,对比研究了膜-生物反应器(MBR)与传统活性污泥反应器(CASR)对两种典型内分泌干扰物——双酚A(BPA)与壬基酚聚氧乙烯醚(NPnEO
随着当今科学技术的快速发展,对非线性时滞系统的控制与滤波设计问题的研究不仅具有重要的理论意义,也具有重要的实用价值。本文基于T-S模糊模型,以线性矩阵不等式技术和Lyap
本工作是法国斯特拉斯堡IPHC(Institut Pluridisciplinaire Hubert Curien)单片有源像素传感器(Monolithic Active Pixel Sensors, MAPS)研发项目的一部分,致力于研究集成于M
绩效考评是银行经营活动中的一项非常重要的管理工具,银行基层机构在日常经营管理活动中,除了要面对利润、存款、贷款、中间业务收入等传统指标以外,还必须高度关注风险内控