论文部分内容阅读
系统发生是通过追溯物种形成过程,分析物种之间的进化关系。最初,物种进化关系由系统发生树表示。然而经过深入研究发现,物种进化过程中常常出现网状事件(如杂交、重组和水平基因转移),导致部分物种拥有多个父辈群体。这时树形结构无法描述它们之间的进化关系。系统发生网络既可以表示网状进化关系,又可以表示多个系统树之间的冲突进化信息。而且系统发生树可以看作是系统发生网络的一种特殊形式。因此系统发生网络的构建对生物进化研究具有重要的现实意义。本文研究了基于物种特征的系统发生网络构建算法。主要内容:⑴深入研究了系统发生树这一特殊网络的构建算法。本文提出了基于距离矩阵构建系统发生树的ENJ算法,它是邻接法的一种改进。邻接法是目前有效构建系统发生树算法之一,它运算速度快,准确率高,且适用于大数据集。但是它会出现结果进化树不唯一现象。ENJ算法可以有效合并三个邻接节点,解决了邻接法产生多个结果树的问题。对比实验中,相比INJ算法,ENJ算法构建的系统发生树与原始树的差异更小,能更好的表示原始树的信息。⑵深入研究了一般系统发生网络的构建算法。本文提出了基于有根系统树构建系统发生网络的Frin算法,它是Cass算法的一种有效改进。Cass算法接受任意的多个系统树作为输入,是目前有效构建系统发生网络算法。但是它受输入数据顺序影响大,运算速度慢。Frin算法基于物种频率和不相容度选择去除物种,削弱了输入数据顺序的影响,加快了系统发生网络的构建。并且实验证明,相比Cass、Lnetwork和BIMLR算法,Frin算法明显削弱了输入数据顺序的影响;Frin算法构建的网络更简单,多余簇的数量更少;Frin算法为禾本科植物有效地构建了系统发生网络。