论文部分内容阅读
本文的主要内容由两个部分组成,内容的第一部分研究了基因组序列的混沌游戏表示的递归迭代函数系统模拟,第二部分我们利用基因组的连接蛋白质序列讨论了细菌的进化相关性问题。
随着我们得到的基因组的逐渐增多,越来越多的研究人员开始从基因组层面上来研究生物体的各种性质特征。 Jeffrey[8]在1990年介绍了DNA序列的混沌游戏表示。后来Fisher等[15]将DNA序列的混沌游戏表示思想推广到了蛋白质数据的研究上。Yu等[20]在2004年首先从基因组的角度分析了连接的蛋白质序列的混沌游戏表示。本文中我们将研究基因组的三种序列(全基因组DNA序列、全基因组的连接的编码DNA序列和全基因组的连接的蛋白质序列)的混沌游戏表示。从这些混沌游戏表示中我们可以看到明显的自相似或分形结构。在分形几何及其应用中,研究的比较广泛的是下面两类问题:第一类是根据给定的数据集与规则可以得到什么样的分形图形,第二类是其逆问题,即根据给定的数据集和分形图形确定规则中的未知参数。这里我们考虑的是第二类问题,根据全基因组序列数据和它们的混沌游戏表示,利用矩方法确定其递归迭代函数系统模拟中的参数,并用测度的累积行走和相对标准误差这两个评判标准来评价递归迭代函数系统对基因组的三种序列的混沌游戏表示的拟合情况。我们发现用递归迭代函数系统来模拟基因组的连接蛋白质序列的混沌游戏表示效果最好。
通过比较各个基因组来分析基因组信息组织的结构和规律,发现与功能密切相关的保守序列,研究物种之间的进化关系是今后基因组序列分析的一个重要方向。本文中我们从三个角度研究了细菌之间的进化关系,第一,通过分析,我们发现递归迭代函数系统中的被估计参数,即概率矩阵,可以反映一些物种的进化分类信息,我们用概率矩阵之间的欧氏距离构建了细菌的进化树;第二,我们也利用细菌基因组的连接蛋白质序列的混沌游戏表示与它们的递归迭代函数系统模拟的测度之间的差的相关距离矩阵构建了细菌的进化树;第三,根据下文中的定义我们用细菌基因组的连接蛋白质序列的混沌游戏表示的测度与其递归迭代函数系统模拟的不变测度的比值所构成的静态时间序列进行交叉相关分析,计算其相关距离,由相关距离矩阵构建细菌的进化树。