基于遗传算法的序列比对方法的研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:jj1385173
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物分子序列数据的快速增长及人类基因组计划的实施,生物信息学逐渐发展起来。在生物信息学中,序列比对问题是生物信息学中最基本的也是最重要的问题之一,通过序列比对可以对序列进行分析,从而预测生物序列的结构和功能。由于序列比对问题可以看成是一个组合优化问题,而遗传算法是一种求解大规模问题的全局性优化算法,因此可以用来解决序列比对问题。本文在基于遗传算法解决双序列比对和多序列比对的问题上进行了研究。对序列比对问题研究之后提出了一种改进的遗传算法来解决序列比对问题。针对遗传算法在解决序列比对问题时容易出现的陷入局部最优、不稳定性等问题,本文进行了三个方面的改进:第一,在遗传算子方面使用了智能遗传算子和普通遗传算子相结合的方法,智能遗传算子的设计是为了能使算法迅速收敛到最优解的区域,并能收敛到最优解,而普通遗传算子的作用是为了能够产生新的基因,从而保持种群的多样性;第二,引入了对种群多样性进行评估的性能指标,即利用方差对种群的多样性进行评估,从而根据种群的多样性选择不同的智能变异率和普通变异率,这样就能够时刻保证种群的多样性,从而避免算法陷入局部最优;第三,停止准则引入了进化周期的概念,通过对当前周期内的最优解与上一周期的最优解之差和阈值的比较来确定周期数是否要加一,当进化周期数达到指定值时输出最优结果,这样做避免了种群过早的陷入局部最优及改善了算法的稳定性。通过上面三种策略的加入,使得改进后的遗传算法在解决序列比对问题上得到了很好的效果。为了验证此方法的有效性,通过实验将这种改进的遗传算法分别应用在双序列比对和多序列比对上,并将得到的结果在字符的匹配列数和适应度值上与经典算法T-COFFEE进行比较,从实验结果和实验分析中可以看出此方法的有效性。
其他文献
目前关系数据库的关键词检索分为基于元组图的方法和基于模式图的方法,这两种方法的基本检索单元都是元组,因此它们本质上是基于元组图的,元组图的缺点是数据规模太大,而且由
当前有关食品安全问题的报道时有发生,如“毒豆芽”、“染色黑芝麻”等,而且,忙碌的上班族常常没有时间购买新鲜的农产品。城市人群希望方便地购买到安全新鲜的农产品,农村人
近十年来,频繁模式挖掘在数据挖掘领域扮演着十分重要的角色.尽管属于数据挖掘中的一个年轻的领域,频繁模式挖掘已取得巨大的进步并获得了多方面的应用.若一个模式频繁地在数
随着网络应用的逐渐发展,用户更加关注网络安全问题,防火墙成为保护用户系统安全的重要手段,也是网络安全领域最为成熟的访问控制技术。目前国内外学者以及安全公司都不断研
随着文化建模的发展,背景知识开始用于预测恐怖组织在特定背景下的恐怖行为。组织的背景知识会影响组织采取的恐怖行为,因此利用组织的背景知识可以提高预测结果的准确率。目
多年以来企业和云提供商一直使用虚拟化的云平台运行应用程序,并且都是在虚拟机中运行。虚拟机技术提供整个硬件层的虚拟化,虽然实现了资源的隔离与控制,但使用成本较高。容
随着信息技术的飞速发展,人们日常的生活已离不开互联网。互联网给人们带来便捷的同时,由于多数网站不符合无障碍标准,使得残疾人无法像健全人那样方便的获取互联网信息。为
煤矿井下分站是煤矿监测监控系统的重要组成部分,是连接井下各数据采集模块与地面监控中心站之间数据传输的桥梁,承担了对井下各参数的采集以及实现分站和中心站之间所有数据
在教学管理部门的数据库中,存储了大量的学生各门课程的成绩数据,这些数据中隐藏着许多有价值的重要知识,如何挖掘出这些知识,对学生的学习和教学管理部门的教学管理,具有重
随着Internet的发展及信息的全球化,人们对不同语言的信息需求越来越多。对于大多数不精通外语的用户来说,想要获取需求的信息存在一定的难度。因此有研究者提出了对跨语言信息