论文部分内容阅读
猪基因组演化过程中,会持续产生新的功能遗传信息,主要包括新基因和新功能突变基因。挖掘这些新的遗传信息有助于找到具有潜在育种价值的优良基因。目前模式生物中的大量研究,均发现新基因与雄性生殖功能、生长发育及免疫功能等活动直接相关,因此猪基因组中的新基因值得深入挖掘和解析。大量猪和其它驯化物种的研究证明,两种主要的选择因素(人工定向选择或自然净化选择放松)会在驯化后作用于功能突变增加的基因(即新功能突变基因),进而产生新的表型变异。但是一些重要的问题依然有待解决:1)驯化后功能突变增加是否具有物种内和物种间的普遍性;2)人工定向选择和自然净化选择放松,哪一个因素主要驱动了猪基因组功能突变的增加;3)在不同的选择压力驱动下,新功能突变基因在组织表达模式、功能重要性方面的异同点。为了挖掘猪基因组新信息,本研究首先采用了模式生物中新基因鉴定的方法,利用具有高质量注释信息的外群物种,对猪基因组演化过程中的新基因进行了挖掘和分析;然后进一步鉴定了猪驯化后的差异演化基因,对其中的新功能突变基因进行了重点分析,同时利用其他8个驯化动物基因组数据进行了方法学上的验证以及结果的比较分析。本研究的主要结果如下:1)总共鉴定了1065个猪基因新基因,起源速率为21/百万年,该速率与灵长类的新基因起源速率近似。其中39%的新基因驱动了猪嗅觉受体基因家族的近期扩张,表明新基因驱动了基因组的持续更新,同时功能注释表明新基因与猪化学信号识别、生长发育、免疫抗性和繁殖活动等生理活动密切相关;野猪基因组de novo组装发现,驯化过程可能没有产生家猪特异性和独有的新基因。2)以RNA起源新基因作为重点,本研究总共鉴定了94个反式RNA起源新基因和36个顺式RNA起源新基因,表明逆转录反转座事件是猪基因组更新的重要方式。新基因及其母基因的―基因穿梭‖分析发现,X染色体过量地产生和接受了反式RNA起源新基因,过剩率分别为530%和506%;同时X染色体也是顺式RNA起源新基因的生产和富集中心,过剩率分别为579%和719%。3)芯片及RNAseq组织表达数据分析发现,50%的RNA起源新基因存在睾丸偏好表达,75%的X染色体产生的反式RNA起源新基因在睾丸中的表达量比母基因的睾丸表达量高,说明X染色体产生新基因的机制可能跟母基因雄性X染色体减数分裂失活(MSCI)的补偿有关。另外,睾丸和肌肉的RNA起源新基因表达量呈线性相关(r~2=82.1%,p<0.001),表明RNA起源新基因在猪的肌肉生长和雄性繁殖方面具有基因多效应。4)顺式RNA起源新基因的基因家族分析以及组织表达分析发现,71.4%的X起源的顺式RNA起源新基因在睾丸组织中有最高表达,说明X染色体的顺式RNA起源新基因也具有重要的雄性生殖功能。X染色体富集了8个顺式RNA起源新基因的串联重复基因家族,这些基因家族呈现睾丸特异性高表达模式。这一结果与小鼠中精子发育必需的基因在X染色体扩增的发现类似。由于MSCI的影响,这些基因的高表达说明他们可能与减数分裂后期的精子成熟有关。另外,至少有12个RNA起源新基因与精子发育及雄性繁殖活动有关。剩下的RNA起源新基因的注释显示,这些基因可能具有繁殖、肌肉发育、免疫抗性的生理重要性。5)驯化前后差异演化基因的Ka/Ks分析发现,猪驯化后Ka/Ks增加,在其他5个中小型驯化物种中也发现类似现象,说明驯化过程增加了功能突变的比例。猪中鉴定了401个驯化前后的差异演化基因,其中新功能突变基因(295个)的比例为74%,其他中小型驯化物种中该比例均高于50%,说明驯化过程导致了新功能突变基因数量的上升。分析猪中295个新功能突变基因受到的选择压力类型发现,受到人工定向选择影响的基因占据68%(202个)。在其他7个驯化动物中,人工定向选择影响的新功能突变基因的比例都高于50%,说明新功能突变基因受到的选择力量主要是人工定向选择,而不是自然净化选择放松。6)利用214个野猪和家猪的群体重测序数据、12个新测样品以及5个外群物种的基因组数据,验证了家猪新功能突变比例高于野猪的结果。另外,分析发现欧洲野猪的新功能突变的比例高于亚洲野猪;通过计算有效群体大小发现这一结果可能与欧洲野猪有效群体大小较低造成的自然净化选择效率降低有关。7)猪和其他物种的差异演化基因比较发现,有8个基因在至少两个物种中共享,这些基因的功能可能与驯化过程中的共同生理活动有关,例如神经系统发育活动、雌雄生殖活动、营养物质代谢与合成、生长和免疫抗性等。8)新功能突变基因在27个组织的RNAseq表达分析结果表明,与受到自然净化选择放松作用的基因相比,人工定向选择影响的基因的组织表达丰度更高,组织特异性更强,说明人工定向选择所影响的新功能突变与驯化过程中对某些特定性状的选育有关。基因表达数据显示,自然净化选择放松作用的基因只有1个表现出组织特异性表达,但是至少90%以上(208/214)的人工定向选择影响的基因存在组织偏好性表达。其中有16个人工定向选择影响的基因在脑组织和内分泌相关组织中主要表达。9)在8个驯化物种中Kr/Kc均大于1,说明极端功能突变的比例高于保守功能突变,同时Kr/Kc在驯化群体中比野生群体更高,表明驯化过程加速了极端功能突变的累积。8个物种的有效群体大小和极端功能突变累积效率之间存在显著正相关,表明有效群体大小增加会促进了驯化过程人工定向选择对功能突变的累积速度。这一结果与灵长类中物种间定向选择效率差异的结果类似。10)新基因和差异演化基因的整合分析发现,有8个新基因也属于驯化前后的差异演化基因。注释显示这些新基因可能参与猪中重要的免疫抗性相关的生理活动。总之,本论文通过大量的基因组和转录组数据,应用经典的分析和计算方法,挖掘了猪物种新基因和新功能突变基因,这些新遗传信息将有助于理解猪基因组演化,同时可能为猪育种应用提供参考。