论文部分内容阅读
随着一些微生物基因组、人类基因组、拟南芥基因组和水稻基因组全序列测定项目的完成和快速进展,以及各种生物的基因和蛋白序列的研究,产生了越来越多的庞大的分子序列数据。对其进行科学的分析、处理和保存推动了分子生物学和数学以及计算机科学的结合,近几年,计算分子生物学已成为生命科学中异常活跃的一个研究领域。计算分子生物学作为现代信息科学、计算机科学、生命科学、数学、统计学、物理学、化学等很多学科相互渗透形成的一门崭新的交叉学科,主要是研究分子生物学与基因和蛋白质序列有关的复杂计算问题。本文主要介绍了DNA序列分析中的图形表示方法以及以DNA序列为基础的种系树的构造。主要研究内容可以概括如下:
本文在图形表示的基础上提出了一种刻画DNA序列相似性新的指标,即曲线和X坐标轴围成面积的平均值。并且以11种物种的β-球蛋白基因的第一个外显子编码序列为例,利用该方法分析了他们之间的相似性以及物种进化系统发生树的构造。这种方法不需要复杂的比对,并且具有准确性高,计算简单等优点。