论文部分内容阅读
系统发育分析是生物学的一个重要研究领域,旨在重建所有物种的进化历史。系统发育树是一棵描绘物种进化关系的树,也叫做进化树。目前重建进化树的方法可以分为两大类:1)基于最优原则的方法,如最大似然法和最大简约法;2)基于非最优原则的方法,如距离法。重建进化树的目的是找出有且仅有的那一棵反应真实进化关系的树。 因为物种进化历史不可重现且其进化规律存在偶然性,所以如何确定真实的进化树一直存在争议,而目前基于单一准则的算法因为噪音等原因,可能不能重建出真实的进化树。本文提出的基于多目标优化算法的进化树重建能够同时考虑不同的进化树重建标准,从而可以重建一组可行进化树,在保证可靠性的前提下提供更多的进化可能性。 本文以多目标进化算法为框架,对16种灵长动物的基因进行了两个实验。第一个实验以进化树的似然值和距离比值为目标,得到的可行解基本符合公认进化情况;第二个实验以进化树的似然值和简约值为目标,得到的可行解较第一个实验更加准确,但是实验花费时间比实验一多。受距离法的启发,对实验二进行改进:随机或者按照规则设置一个距离比值作为阈值,将距离比值大于阈值的树直接舍弃;并且在初始种群中加入一棵基于距离贪心法的“领导解”,加快在种群进化初期进行阈值筛选,从而加快实验的运行速度。 通过对比参数(如种群个数N、子问题邻居个数T等)对于实验效果的影响验选择参数最优值。并将改进后的方法应用于其他的数据集中均得到较满意的解。