【摘 要】
:
随着社会的进步和科学技术的发展,IT技术相关的各个行业都呈现出高速发展,与其相关的海量信息也迎面而来,如何从海量的数据信息中提取有用的信息,进而更好帮助我们预测和指导
论文部分内容阅读
随着社会的进步和科学技术的发展,IT技术相关的各个行业都呈现出高速发展,与其相关的海量信息也迎面而来,如何从海量的数据信息中提取有用的信息,进而更好帮助我们预测和指导相关的实践工作,是当前面临的一大困境。函数发现是数据挖掘的重要分支之一,其存在目的就是对海量数据进行处理,最终发现其中存在的规律和变化趋势,形成一种函数模型。本文主要研究基因表达式编程(GEP)在函数发现中的应用。GEP是Ferreira在继承遗传算法(GA)和遗传编程(GP)的基础上提出的第三类新型进化算法,它集中了GA和GP的优点,并且克服了不足之处,最终实现通过简单的编码解决现实生活中复杂问题的目的,更适合函数发现方面的应用。函数发现问题归根结底可理解为通过优化分析,最终得出与原函数拟合度最高的函数,其中,数值常量的处理方式是决定GEP算法能否很好解决函数发现问题的重要因素之一。本文提出了一种嵌合遗传算法的基因表达式编程的函数发现算法(GEP-GA),该算法改进之处就在于提出了一种新的常量优化方法。在函数发现过程中分别通过两种措施对每一代的优化过程进行处理:首先,在固定常量集前提下,由常规的GEP算法确定函数结构;其次,使用GA对第一阶段得出的函数结构的常量进行优化,并将优化后得到的常量做为下一代的固定常量。实验结果表明,GEP-GA比以往指定常量的常量处理方法(GEP-MC)效果有较大提升,并且更加智能化。GEP-GA在解决函数发现问题的时候,随着问题规模的增大和函数复杂度的提升,GA在全局搜索优化方面渐渐的表现出一些缺陷,例如,搜索速度比较慢、进化时间长、局部的搜索能力也变得越来越差等等。如何解决GA在实际问题中存在的缺陷是近几年来研究者们广泛关注的焦点。面对以上问题,本文充分利用遗传算法天然的并行性,将Spark集群的高速并行性和遗传算法天然的并行性相结合。实验结果表明,Spark的加入减少了GA未成熟收敛的可能性,提高了求解质量,在加快搜索速度、减少进化时间、提高局部搜索能力等方面更是表现出很好的效果。
其他文献
在半导体行业中,图案化技术至关重要。随着集成电路的高度小型化和集成化发展,作为目前半导体行业的核心技术,光刻技术面临着衍射极限带来的技术复杂化和制备成本大幅度提高
过去的近二十年间,我国风电事业快速发展,装机容量多年稳居世界首位。风能提供清洁、可再生能源的同时,也暴露出诸多问题,其中,由于处于高空、不稳定载荷、极端温差等运行环境中,风电机组的故障率较高,传动部件的故障会导致较长的停机时间,严重影响发电量和经济效益。状态监测与故障诊断是保证风电机组可靠运行、减少运维成本的关键技术。振动监测作为状态监测的主流技术,在风电机组应用广泛,但也存在诸多不足,例如振动分
基于动态搜索的Web应用测试通过动态搜索Web应用的用户接口状态空间,实现Web应用的自动化测试。Web应用用户接口状态空间大多具有指数级复杂性,“穷尽搜索”易陷于局部或不相
随着计算机与信息技术的快速发展,实时嵌入式系统在人们的现实生活中得到了广泛的应用。在现有的嵌入式系统设计中,通常采用相应的任务模型对系统进行抽象。相对于大部分已有
随着计算机技术的发展,互联网已经成为人们生活中不可或缺的重要组成部分。搜索引擎、信息查询和社交网络在人们生活扮演着越来越重要的角色。字符串匹配在这些领域中被广泛
在电子电气领域的高度集成化、小型化趋势下,对于内部器件的散热性能要求越来越高,高分子材料因其耐腐蚀、低介电常数、质量轻强度高、低绝缘电阻等优异特性被广泛应用于电子电气、微电子封装等领域,尽管高分子材料有众多优点,但它的热导率一般很低(0.1~0.5 W/(m·K)),致使电子器件产生的热量难以迅速散出,容易造成器件局部过热使得器件失效甚至损坏,这也限制了高分子材料在该领域的进一步发展。因此,如何有
在目前全球天然气资源的大量开发、电网调峰日益增长的需求以及分布式能源系统的飞速发展的背景下,燃气轮机在我国发电领域的地位越来越重要。为确保燃气轮机能持续安全稳定可靠的长时间运行,其健康状态越来越成为重要的研究内容。目前大数据技术蓬勃发展,将其融入对重型燃气轮机健康状态的研究中是大势所趋。因此,通过监测燃气轮机实时数据,发现健康状态的早期异常,运用数据手段预测健康状态的发展趋势,及时对影响机组健康的
河流水系是联系水陆空能量转换的重要纽带。但在全球性气候变化以及人类活动的影响下使得流域水循环过程发生巨大转变,流域蒸散发、降水、径流、泥沙及其时空分布发生剧烈变化。探讨水沙演变规律及其驱动因素,为流域综合管理提供参考依据。本文以长江流域为研究对象,以研究区199个气象站和干支流12个主要控制站1956-2015年实测水文气象数据为基础,结合研究区主要大型水库要素特征信息及5期土地利用数据,分析近6
中国的城市更新是在加速城市化的背景下进行的,在这种特定环境下,人们往往倾向于刻意强调以城市空间、人口、经济规模为主要特征的机械、假性的城市“生长更新”,然而,城市体系对适应城市化进程和社会发展变化的实际需求却被忽略,导致中国城市处于快速城市化当中,缺乏自我调节和更新能力,新旧关联薄弱以及更新费用增加,极大地影响了城市的发展和城市化进程。旧城改造是棚户区改造的前身,棚户区改造实际上是旧城改造的演变式
为了探讨中国晋冀蒙地区汉族人群中ESR1基因多态性与甲状腺乳头状癌(Papillary thyroid carcinoma,PTC)发病风险是否相关。采用病例-对照研究方法,收集2017年1月~2018年10月间,经河北北方学院附属第一医院耳鼻咽喉—头颈外科手术后确诊的123例PTC患者为病例组,同期来自河北北方学院附属第一医院体检中心的108例健康参与者为对照组。所有研究对象均为中国晋冀蒙地区的