论文部分内容阅读
插入/缺失(Indel)是分子水平上基因组自发突变的一种重要形式。本研究在全基因组的范围内,通过对拟南芥的两个生态型Col和Ler之间序列的比对,以及在拟南芥一千余个位点、96个生态型中遗传多态性的分析,系统调查了插入/缺失的分布密度、大小、GC含量等遗传特征在基因组水平和群体中的分布规律。研究发现,大部分的indel都是小indel,长度主要集中在1~10bp区间,占所有Indel的85.67%;相对于基因组中的其它序列,Indel的GC含量较低,且indel主要发生在低GC含量的区域;Indel和SNP在拟南芥群体内的分布皆不符合中性模型,但indel与中性模型的差异较小;区域内序列的核苷酸差异度与indel的密度呈正相关,但随indel的距离越远,序列的核苷酸差异度越低。据此,我们推测,indel不仅本身是遗传变异的来源,同时还与SNP的产生或保留相关。为验证这一假设,我们进一步在人类3个单倍体染色体之间和酵母的6个全基因组测序的菌株进行了Indel遗传多样性的调查。结果进一步验证了在拟南芥物种内结果的普遍性:即Indel周围具有核苷酸差异升高的现象;核苷酸差异都与距indel的距离呈负相关,并且与indel的大小、频率显著相关。 本研究在全基因组的范围内,分别对拟南芥、人类和酵母物种内Indel的分布规律及其与周边SNP的关系进行了系统研究,不仅从物种内进一步证实了Indel与SNP具有显著的正相关相关,并对其潜在的两种可能机制,即Indel诱变机制及indel抑制重组所导致的分子隔离机制做了详细的阐述;其次通过的indel的分布规律、遗传特性、产生与保留的原因的系统分析,为进一步探讨生物遗传变异的来源与动力奠定了基础。通过对物种内indel的分布规律及其周边SNP的系统研究,为我们进一步了解indel对遗传突变的作用与贡献,重新认识了遗传变异的产生与保留、生物多样性的发生与变化、物种的产生与进化等有着重要理论意义。