论文部分内容阅读
DNA进化的马尔可夫模型是以同源DNA多序列比对数据为依据的分子进化和系统发育重建的数学基础之一。由这类模型所推导出的同源DNA序列间进化距离的计算公式以及核苷酸突变的置换概率矩阵,在近30年的DNA分子进化和系统发育推断分析中所采用的一系列距离法和最大似然法中得到了广泛的应用,出现了诸如JC69、K80、F81、HKY85、 F84、TN93、GTR (REV)和UNREST等许多模型。但是,这些模型仅涉及DNA进化中的核苷酸置换(substitution)事件,而未将核苷酸的插入或缺失(insertion/deletion, indel)这一突变事件所包含的信息考虑在内。McGuire (2001)等人首次将比对间隔(alignment gap)视为马尔可夫过程的第5种核苷酸状态的处理方法引入到最大似然法中,并在JC69、F81和F84等模型的基础上提出了包含间隔在内的5种核苷酸状态相互置换的JC69+gap、F81+gap和F84+gap等涉及插入/缺失信息的DNA进化模型,一定程度上消除了以往模型的缺陷。然而,这些模型将插入或缺失视为与碱基置换同样的突变事件,没有区分插入/缺失突变与核苷酸置换在性质上的差异。本文在McGuire等人方法的基础上,针对性地引入了新的参数以区分核苷酸置换和插入/缺失这两种DNA突变事件,提出了JC69+gap’、F81+gap’、HKY85+gap’和F84+gap’等一系列的改进模型。同时,为比较和评估已有模型和改进模型,分别以真实DNA序列比对数据和计算机模拟DNA进化序列数据作为测试数据,采用最大似然法进行系统发育重建的对照分析。结果表明:第一,在似然值检验这一方面,仅F84+gap模型比改进的F84+gap’表现略好以外,其它改进模型均优于已有同类模型;第二,在系统发育树拓扑枝长估算的精确度上,新建模型均优于已有模型。