论文部分内容阅读
驯化是生物在长期的自然选择和协同进化过程中,物种间演化出的一种互利共赢的生存方式,是将自然环境下的动物或植物繁育改变为人工控制下的过程。马的驯化是一个复杂有趣的过程,始于5500年左右或者更早,并在短短的几千年内极大地影响了人类文明的传播。近年来,关于马的驯化的研究,主要涉及马在什么时间被驯化,以及马如何被驯化,这些研究主要聚焦于蛋白质编码基因。长链非编码RNA(long non-coding RNA,lncRNA)能够将表观基因组修饰酶携带到基因组特定的位置,表观基因组修饰对基因表达的调控很可能相当程度影响了驯化。目前没有关于马lncRNA与驯化关系的研究。在本课题中,我们分析了马驯化过程中lncRNA及其可能靶基因(至少一个lncRNA在其启动子区域有DNA结合位点)的变化,并根据GO(Gene Ontology)数据库和KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库等分析了靶基因的通路富集特性。我们分析了古马和现代马的DNA序列,包括1匹公元前4万年前没有驯化的野马、1匹5500年前的Botai 马、1匹2300年已经驯化的古马和1匹现代马。我们综合分析了这4个时期较高质量的65个lncRNA序列和22341个启动子区域(+3500~-1500 TSS)序列,发现lncRNA序列变化不大(以序列距离度量),仅仅58个lncRNA就已经有2289个可能的靶基因,而且形成了一个潜在的复杂庞大调控网络。其次,驯化过程中伴随着TTS(triplextarteging site,即lncRNA的DNA结合位点)的丢失和获得,从野马到现代马TTS结合亲和性逐渐增高的靶基因涉及免疫应答和神经系统调节,lncRNA的靶基因还包括一些已经报道的和驯化相关的基因。我们的分析结果支持驯化机制的“神经脊”假说。GO和KEGG通路富集分析结果表明靶基因主要和嗅觉、感官刺激反应基因相关,部分靶基因和代谢通路、神经活性配体-受体相互作用通路(Neuroactive ligand-receptor interaction)等显著相关。这些结果表明 lncRNA介导的表观遗传调控极大地推动了马的驯化。一个重要而有待深入研究的问题是,此结论是否具有一般性,即在其它动物中,lncRNA对驯化的影响是否也聚焦于这些通路。