基于生物信息学的冷休克结构域蛋白家族进化研究

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:zhangyanmin2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文基于公共数据库数据,以冷休克结构域(cold shock domain)蛋白超家族为例,利用生物信息学的理论和方法,对冷休克结构域蛋白超家族的分子进化进行深入研究,目的是揭示冷休克结构域蛋白超家族基因起源和进化的分子机制以及基因非编码区调控作用,并为深入研究其他基因家族以及超家族进化机制提供新的思路和方法。本文的主要研究结果如下:(1)运用NJ法和ML法对84条冷休克结构域蛋白的氨基酸序列进行系统发育进化树构建,发现该系统发育树由3个大簇(CladeⅠ、CladeⅡ和CladeⅢ)构成,其中CladeⅠ是包含物种种类最多的一簇,从鱼类黑青斑河豚到哺乳动物人类,从基因结构看这一簇成员基本都包含长度为64、34、90的外显子,并且内含子的插入相位也大致相同,这个位置正是编码冷休克结构域的氨基酸位置,说明冷休克结构域在这些成员当中是很保守的;CladeⅡ多是无脊椎动物一簇,从低等的克氏锥虫到蜜蜂、果蝇,该簇在基因结构上表现为外显子数目少,且碱基数较多,同时在线虫中还发现4种旁系同源产物Cey1、Cey2、Cey3和Cey4蛋白;CladeⅢ是植物一簇聚集到一起,从系统发育树中看CladeⅢ和CladeⅡ聚集在一个树枝上,该簇含有的外显子数目也是很少的,且内含子数量少甚至不含有内含子。(2)通过对氨基酸序列motif进行分析,发现高等动物比低等动物含有更多数量的motif,而在植物中含有的motif数量更少,但植物中单个motif种类的重复则较多。(3)对冷休克结构域蛋白基因的mRNA的3′、5′UTR区域进行研究,结果表明在3′UTR区域的功能元件比5′UTR区域的多。采用同源序列比对发现在UTR区域的序列保守性相对较差,碱基间也发生了较大的突变。(4)对各个冷休克结构域蛋白基因中的内含子做重复序列分析,发现在由无脊椎动物到脊椎动物进化的过程中,内含子重复序列元件在增多,但重复序列元件增加的数量各有不同,说明内含子在插入外显子中的位点也相应的增多。此外,亲缘关系相近的物种,其重复序列元件在基因结构上又具有一定的相似性。更进一步的研究发现重复序列元件的种类与内含子总长度和GC含量密切相关。通过对上述研究结果的综合分析,初步模拟出了冷休克结构域蛋白家族的进化模型,即在物种形成冷休克结构域蛋白的初期是由基因复制产生直系同源蛋白,随着物种的进化由于选择性剪接进而产生旁系同源蛋白,从而使得该蛋白家族成为一个多功能蛋白家族。本文的研究结果也为更深入地研究基因家族以及超家族进化机制提供了新的方法和启示。
其他文献
自从"高阶理论"提出以来,高管团队多样性一直是学者们研究的热点,并且已经取得了大量的研究成果。本文从高管团队的定义、高管团队多样性的结果变量、高管团队多样性的"黑箱
以丙烯酸全氟烷基酯(Zonyl TM)、甲基丙烯酸甲酯(MMA)、丙烯酸丁酯(BA)为原料,在阴离子乳化体系中制备了含氟丙烯酸三元共聚物乳液.研究了聚合反应动力学、转化率的各种影响
<正>冷暖一体化,即舒适家居系统,这一概念盛行于20世纪八九十年代的欧美发达国家。随着中国经济的日益发达以及人们对家居生活意识的不断提升,近几年,冷暖一体化被业内以及众
无刷直流电机具有工作效率高、使用寿命长、运行噪声低以及良好的调速性能等诸多优势,在汽车工业、航空航天、家用电器等领域内得到了十分普遍的应用。论文以Freescale公司的