构建系统发生树的进化算法

来源 :扬州大学 | 被引量 : 0次 | 上传用户:panxuanyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
系统发生树的构建是一个非常具有挑战性的问题,对此问题的研究在生物信息学中变得越来越重要。由于可能拓扑结构的系统发生树数目随着物种数目增加呈指数形式增长,关于最优树的构建问题都是NP-Complete问题,巨大的搜索空间使得系统发生树的构建极其消耗计算资源。当物种数目很大时,没有一种优化算法能在适当的时间内计算得到其精确解,因此,寻找能够在合理的时间内得到最优近似解的算法就有很强的实际意义。遗传算法(Genetic Algorithm)和蚁群算法(Ant Colony Algorithm)是两种求解复杂优化问题的模拟进化算法。大量实验结果表明,这两种算法在解决许多组合优化问题时都能表现出较好的求解能力。针对系统发生分析问题的组合复杂性,及遗传算法和蚁群算法在解决此类问题中的优势,本文将这两种算法应用于系统发生树的构建问题,提出了四种系统发生树的构建方法。首先,本文提出了一种构建系统发生树的遗传算法GA-PTC,将可能的系统发生树的拓扑结构编码成问题的解空间,并在解空间中搜索最优树。在此方法中,我们提出了系统发生树的后缀表示法作为遗传算法的编码方式,在对个体评价时,采用基于距离设计的适应度函数对个体进行记分,并根据选择概率与适应度成正比的赌轮盘选择策略从父代中选择部分较优个体,然后通过遗传操作产生新一代个体。实验结果表明,此算法能够得到正确的系统发生树。其次,本文在分析蚁群算法的原理及性能的基础上,提出三种基于蚁群算法的系统发生树构建方法:(1)基于TSP问题的构建系统发生树的蚁群算法TSP-PTC。给定一个物种集合以及它们之间的距离矩阵,我们可以构造一个带权图。对于图中的每一条哈密尔顿回路,都可以对应于一棵系统发生树,在所有回路所对应的系统发生树中,适应度值最小的是TSP问题的解所对应的系统发生树。因此我们可以利用蚁群算法在带权图中寻找最优路径,然后用此回路及物种之间的距离构建系统发生树。在构建系统发生树时,首先根据回路构建其拓扑结构,然后根据拓扑结构和距离矩阵给各边分配权值。此方法比传统算法构建出来的系统发生树的准确度要高。(2)基于蚁群聚类的构建系统发生树的蚁群算法AC-PTC。在算法开始搜索之前,同样将物种群用一个带权图来表示。图中的顶点表示待研究的物种,边上的距离用蚂蚁在访问图的过程中所积累的信息素来衡量。用蚂蚁遍历该图并在遍历过程中更新信息素,在算法停止迭代后删去图中某些信息素较少的边,然后通过求该图的强连通分量达到对物种聚类的目的。我们在算法中引入了信息素的自适应更新策略,以防止算法早熟和局部收敛。最终系统发生树由各个聚类构建而成。(3)基于后缀表示的构建系统发生树的蚁群算法SR-PTC。在此方法中,蚂蚁访问物种集合的目的是形成一个对应于最优系统发生树的后缀表示序列。一个合法的后缀表示序列对应于一棵二叉树。为构成一个合法的系统发生树的后缀表示,蚂蚁对内部结点的选择要受到限制,我们分别为叶结点和内部结点设置两个不同的选择概率,并用赌轮盘选择方法来决定两种结点的选择。另外,在信息素更新时,加入当前树的评价值来影响蚂蚁的运动方向。我们用本文的算法与传统的系统发生树构建方法进行了比较。实验结果表明,三种基于蚁群算法构建系统发生树的方法都能得到较为准确的拓扑结构。另外,我们还分析了本文提出的三种基于蚁群的系统发生树构建方法在解决不同问题时的性能。实验结果表明,TSP-PTC方法构建出的系统发生树在准确度最高,AC-PTC方法在物种数目较大时消耗的时间最短,而SR-PTC方法在物种数目较小时速度最快。
其他文献
以香港、台湾和内地电影为主体的中国电影,民族文化传统和东方美学品格是贯穿始终的文化血脉,也是民族电影的文化之“根”。从20世纪70年代末开始,香港、台湾和内地先后掀起的“
根据兖州物业分公司近几年实际运行工作经验,探讨如何搞好物业管理服务,实现企业后勤系统结构调整,由行政性、福利性管理方式向市场化管理转变。
水飞蓟宾(silibinin)是天然的黄酮木脂素类化合物,为菊科植物水飞蓟(Silybummarianum)的果实经提取精制而得,具有稳定细胞膜、改善肝功能的作用,对急慢性肝炎、肝硬化和代谢中毒
目的:观察活血化瘀解郁方治疗气滞血瘀型脑卒中后抑郁(Post-stroke depression,PSD)患者的临床疗效。方法:选取60例气滞血瘀型脑卒中后抑郁患者作为研究对象,按就诊顺序随机
尊敬的各位领导、各位委员、各位代表:大家好!在全国科学技术名词审定委员会第五届委员会全体会议暨成立二十周年纪念大会召开之际,请允许我代表新闻出版总署对大会的隆重召开
基于组件的软件开发方法,旨在复用已有的、经过验证的软件组件来构造应用系统,这不仅可大大减少软件开发的人力、物力投入,缩短开发周期,同时也有利于提高软件的质量,因而它是实现
目的:分析电外科器械绝缘性能检测合格率及其影响因素,为制定标准的操作流程提供参考。方法:选取医院接收的电外科器械绝缘性能检测结果数据,分析查找检测中存在的问题,制定
目的:探讨素子长期分离对农村留守儿童自尊的影响。方法:对取自重庆、贵州两地乡镇的837名中小学生(包括留守及非留守儿童)进行自尊水平及相关影响因素的调查。结果:父母双方均在
本文从跨境资金异常流动的主要渠道和特点入手,分析了当前跨境资金流动监测面临的挑战和存在的薄弱环节,有针对性地提出了对策建议。