论文部分内容阅读
基因重复是在生物体细胞内产生相似DNA片段的事件,是真核生物中重要的生物学过程,并在物种演化过程中扮演重要角色。基因重复能够为生物体基因组的演化及新功能基因的产生提供最基本的物质和原材料基础,并由此导致新物种的诞生。生物体通过基因重复事件来增加基因组中基因的拷贝数,以适应不同环境及发育的需要。因此,对基因重复遗传规律的研究,可进一步了解生物体演变规律,为人工定向改造基因、人为创造新基因以提高物种品质提供理论基础。本文从12个已测序的、全球分布的果蝇基因组中,鉴定出了 22488个基因家族,其中存在新近重复的基因家族共3647个,占基因家族总数的16.2%。依据不同的扩张模式,我们进一步将这些新近重复基因家族分为三类:物种特异性扩张、世系特异性扩张及复杂型扩张基因家族。其中第一种扩张类型占据了极大的比例(86.6%)。在同一个复杂型扩张基因家族中,存在多个不同物种之间发生独立的物种特异性基因重复事件;在物种特异性扩张基因家族中,不同物种共有新近基因重复热点。这些结果表明,这些新近重复基因受到趋同演化的作用。通过对新近重复基因蛋白质结构域的比较发现,新近重复基因具有功能偏好性,并多与应对环境刺激及生物胁迫有关。对新近重复基因的旁系同源基因和直系同源基因的非同义替换率(Ka)和同义替换率(Ks)的计算发现,部分基因受到正选择压力的驱动(Ka/Ks>1)。对这些受正选择作用的新近重复基因家族的功能评估表明,其存在功能偏好性,并与其地理分布、食物来源等因素相关。说明,果蝇基因组中的新近重复的基因为了应对不同的生态环境而受到了适应性演化的驱动。为了进一步验证重复基因对于环境、发育过程等因素的适应性,我们对果蝇基因组中的胰蛋白酶基因家族以及线虫基因组中的patched同源基因家族的扩张和演化模式进行了进一步探讨。首先,在12个果蝇物种中,我们发现了 2598个胰蛋白酶基因拷贝,平均每个物种中有217个,但这些基因拷贝在12个物种中分布并不均匀,数目从167到258个不等。那些具有相近亲缘关系的物种基因组内胰蛋白酶基因拷贝数比较相近,说明胰蛋白酶基因重复事件与果蝇物种的系统发生相关。以腐烂水果为生的果蝇基因组中胰蛋白酶拷贝数显著大于以腐烂树木为生的果蝇,且分布于非洲的物种基因组内的胰蛋白酶数要显著高于分布于美洲或亚洲的物种,因此,食物来源在胰蛋白酶基因演化过程中起到十分重要的作用,而地理分布则作为一种附加的诱导因素。通过推断胰蛋白酶基因重复事件发生的时间发现,这些重复事件并非同时发生,而是与生态环境的改变或是宿主改变相关的。此外,我们还发现,狭生性物种相对广生性物种具有较高的Ka/Ks值以及动态的基因重复/缺失事件。说明,该家族的基因重复在果蝇适应不同生态环境中起到了重要的作用。其次,对patched同源基因家族的研究表明,patched同源基因在植物和动物中都比较保守,而且patched同源基因的扩张事件应该发生在线虫物种形成的早期。通过对系统发生树、基因和物种的协调树的研究以及对Ks值的计算发现,PTR类型基因在线虫物种形成之后相对较短的时间内发生了两次扩张。此外,相对近期起源的patched同源基因相较于相对古老起源的patched同源基因,它们的外显子数目较少并且CDS长度较短。不同类型的patched同源基因具有不同的演化模式,PTR类型基因的扩张有利于线虫特异性的适应。本文通过近缘物种中重复基因的比较发现,尽管不同的基因重复家族存在不同的基因功能偏好及遗传变异特征,但纵观整个研究,这些基因重复却具有极相似演化模式,那就是适应性演化在重复基因的演化历程中扮演了重要的角色。