论文部分内容阅读
随着人类基因组计划的完成,以及其它物种测序工作的大规模进行和逐渐完成,大量生物基因组DNA序列信息被挖掘和存储到各种数据库中。与此同时,生物信息学的飞速发展和大量生物学软件的开发,为分析庞大的DNA序列数据提供了有效的工具。现在通过互联网,人们可以快速地搜索和获取这些信息,因此,全面、系统地把握基因组显著特征,分析物种的进化成为当前生物学研究的一个重要课题。2003年,人类男性Y染色体测序工作完成。Y染色体的男性特异区常染色质中最显著的特征是具有8个巨大的回文序列(P1-P8)。这些回文包含了几乎所有的男性特异性表达基因和转录单元,对男性性别特征的进化有非常重要的意义。在生物基因组中,长回文序列非常不稳定,往往导致所在基因组的破损、缺失和淘汰。而Y染色体中的8个巨大回文至少稳定遗传了几百万年。由于其重要的生物学意义和独特的进化稳定性,本文深入研究和讨论了人类Y染色体上巨大回文序列的进化特征。主要研究成果可概括为如下四个方面:1.研究了P2和P3回文内串联重复区中重复单元的突变频率和突变类型。结果显示出这些串联重复序列中的重复单元具有明显不同的突变偏好,因而导致的结果是:在P2重复区中的GC含量呈上升状态,而P3重复区中的GC含量正急剧下降。分析得出:许多不同的因素和突变模型,及一些来自于P2、P3巨大回文结构的影响,共同控制着串联重复序列的突变类型。2.研究了P2、P3回文的结构特征和序列组成,进而讨论了回文序列特征的统一性和多样性。在此基础上,提出了一种P3回文的进化模型。3.讨论了P2回文内串联重复序列的进化特征。尝试把一个重复序列划分成几个子重复序列,利用重复单元之间的差异位点信息,引入聚类和相关分析的方法确定重复序列中不同成分之间的关系。结果显示出一个重复序列中包含的子重复序列之间存在不同的进化特征。4.旨在建立一种方法,通过分析DNA某些序列特征,可以在大尺度上区别出有基因进化趋势的序列。初期结果显示:含“CG”的三联体的分布似乎都有一个共同特征:相邻位点之间的各种“距离值”都有着相同的出现概率。目前,人们对人类Y染色体男性特异区8个巨大回文序列的进化以及序列特征知之甚少,现有的文献主要集中于研究由回文序列之间的同源序列引起的疾病(男性不育症)和染色体变化,只有通过查阅有关Y染色体,以及有关男性不育症的文献,才能间接地对这8个巨大回文结构以及其中基因等序列信息有所了解。本文通过分析人类Y染色体回文序列所遵循的进化特征,深入地研究了Y染色体回文序列的起源以及生物学功能,希望为最终揭开性别起源和稳定进化提供知识基础和研究线索。工作中尝试了一些新的分析方法,希望为DNA序列研究提供新的思路和经验。