论文部分内容阅读
生物序列是由较小的单元组成的无分枝的线性聚合体大分子。对于DNA,这些单元是A(腺嘌呤)、C(胞嘧啶)、G(鸟嘌呤)和T(胸腺嘧啶)这4种核苷酸残基;而对于RNA,这些单元是A、C、G和U(尿嘧啶)这4种核苷酸残基。因此,组合学和统计学的工具和方法可以在分析禽流感病毒序列相似性上发挥很大的作用。同样我们可以利用几何和代数的方法来研究禽流感病毒序列。本文的主要工作包括以下几个方面:在第一章我们介绍了禽流感的概况和生物信息学。大多数后面要用到的术语和基本概念都在这里做了简要介绍。在第二章我们考虑了H5N1病毒DNA序列的一种新的矩阵表示,并讨论了其数值特征。在第三章我们考虑了H5N1病毒蛋白质序列的一种新的曲线映射,也讨论了其数值特征。在第四章我们根据DNA序列的矩阵表示和蛋白质序列的曲线映射计算了新的不变量,并且基于这些不变量,我们分别计算出了80种H5N1的DNA序列的HA片段和123种H5N1蛋白质序列之间的相似矩阵,基于相似矩阵又进一步构建出了系统进化树,最后分析了它们各自之间的相似性。在第五章我们做出了总结和展望。