基因表达式编程理论及其监督机器学习模型研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:ngnza
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因表达式编程是进化算法的新成员,虽然得到了广泛而深入的应用研究,但至今尚未有系统和完善的理论研究成果,还无法揭示其运行的数学机理,对于一些关键技术的改进也就缺少了理论支撑,这对基因表达式编程和进化算法的研究和发展都是非常不利的。此外,目前经典的机器学习方法在解决分类和复杂函数关系发现问题时所构建的监督机器学习模型,在可理解性、精度以及泛化能力上,还存在诸多问题。有鉴于此,本文对基因表达式编程理论和关键技术进行了系统的研究。首先,通过分析基因表达式编程的运行机理,利用一系列的数学推理,构建了基因表达式编程的模式理论,给出了基因表达式编程的基因块假设,分析了基因表达式编程的模式收敛性,其次,基于模式定理成立的必要条件,提出了自适应遗传算子的设计方案。最后,在理论研究的基础上,对基本基因表达式编程中的染色体生成、个体解码求值等关键技术提出了改进方法,进行了理论和实验分析后给出了改进的基因表达式编程算法。在监督机器学习模型研究方面,为了提高学习模型的噪声数据处理能力和泛化能力本文基于改进的基因表达式编程算法构建了监督机器学习模型,对算法的适应值函数和算法提前终止条件进行了重点研究,并通过两类分类、多维分类、复杂函数关系发现问题等实验对此监督机器学习模型的有效性进行了验证。本文的主要研究成果包括:(1)证明了基因表达式编程有效的同时为更深入地研究基因表达式编程奠定了理论基础。本文通过研究和分析遗传算法、进化规划、进化编程、遗传编程、基因表达式编程各自的特点,对基因表达式编程进行了形式化定义,在此基础上,证明了个体编码的合法性,给出了基因模式和基因表达式编程模式的定义,通过一系列的数学推理过程,构建了基因表达式编程的模式理论,给出了基因表达式编程的模式定理和基因块假设,利用数学分析的方法揭示了基因表达式编程的运行机理,最后,给出了基因表达式编程的模式收敛性证明,指出了采用精英保留策略可以防止基因表达式编程中最优模式丢失的问题。(2)提出了自适应遗传算子方案。本文深入研究了优势模式在相关遗传算子作用下的存活概率,给出了基因表达式编程模式定理成立的必要条件,在满足模式定理成立的必要条件下,对遗传策略和遗传算子的参数设计进行了研究,指出了相关遗传算子的参数选择上限,并提出了自适应遗传算子设计方案,最后就自适应变异算子进行了相关实验研究,验证了自适应遗传算子设计方案的可行性;(3)提出了改进的基因表达式编程算法。本文在理论分析的基础上,结合实验研究,对基本基因表达式编程中的染色体生成、多样化种群、个体解码求值等关键技术提出了改进方法,给出了相异结构染色体生成、个体快速解码求值等算法,并进行了相关理论和实验分析,最后,基于这些改进思想给出了改进的基因表达式编程算法;(4)构建了有效的监督机器学习模型。本文基于改进的基因表达式编程算法构建了监督机器学习模型,用于解决分类和复杂函数关系发现问题。通过构造独特的适应值函数和交叉验证方法来获得改进的基因表达式编程算法的提前终止条件,提高了所构建的机器学习模型的噪声数据处理能力和泛化能力。Monk’s problems、乳腺X光片微钙化点检测、wine recognition、复杂函数关系发现、定量构效关系建模等相关实验结果进一步验证了此机器学习模型的有效性。
其他文献
目的评价吸烟与非吸烟药物性牙龈增生患者单纯牙周非手术治疗1个月后的临床疗效。方法2007年3月至2007年12月收集河北省人民医院口腔科钙拮抗剂类药物导致的牙龈增生男性患者
本文在阐述文化营销内涵的基础上,进一步研究了我国服装企业文化营销现存问题,并在此基础上提出了我国服装企业实施文化营销策略的方法和战略。
传统的批量制造系统已难以应对激烈的市场竞争和快速的需求变化,柔性自动制造系统应运而生。对此类系统的分析与控制因而成为生产系统领域中的研究热点问题。本学位论文主要
山东是我国柞蚕生产的发源地区,其历史至少可上溯到公元前的西汉时期,但作为一项农业经营,直到清代才有显著发展。其间,柞蚕放养技术日臻成熟,生产经营规模日趋扩大,并巳成为
反馈控制系统的设计限制以及网络控制系统的性能优化问题是当今科学研究的前沿和热点问题。研究系统性能极限与控制系统的内在特性,比如,非最小相位零点、不稳定极点及其参考信
混沌运动是自然界中客观存在的、最终有界的、有一定随机规则的、非常复杂的运动形式。它广泛地存在于自然界。近十几年来,混沌科学与其它科学互相渗透,无论是在生物学、物理
近年来神经网络在许多领域都得到了广泛的应用。前馈神经网络是一种构造简单而应用广泛的神经网络模型,其主要的训练算法是梯度法。为了提高算法的训练性能,人们对梯度算法作