选择压力算法及应用与哺乳动物小内含子的进化动力学研究

来源 :中国科学院大学(中国科学院北京基因组研究所) | 被引量 : 0次 | 上传用户:kerrytony
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
哺乳动物基因组数据海量和高速度的产出,对比较基因组的分析方法提出了新的要求。非同义替代率与同义替代率的比值广泛的用来衡量不同物种之间序列水平的选择压力,已经存在大量的核酸替代模型和计算策略产生了不同的计算方法。我们曾经引入伽玛分布的形状参数刻画不同位点的突变率的变化得到γ-MYN方法,本文中我们报道其它几种常用方法的修正形式:γ-NG、γ-LWL γ-MLWL、γ-LPB、γ-MLPB和γ-N。我们研究了不同位点突变率变异对不同模型的影响以及与Ka/Ks计算相关的四种进化参数的交互特征。结果表明新参数的引入在负选择的情况下产生与正选择的情况下相反的效应,新方法的灵敏性和准确性相对于原方法得到提高。我们将该系列方法嵌入到单机版软件包KaKsCalculator的核心工具箱,并且开发了沿5’到3’方向移动窗口策略识别正选择位点的扩展工具。我们选择了人和其它11种高覆盖度的哺乳动物基因组和一种鸟类基因组作为外群,评估8种方法计算Ka和Ks的表现,发现这些方法得到的Ka值比Ks和Ka/Ks值要一致得多。可能的原因有:真实数据的异质性;非同义替代数过少导致的复杂模型和多击中修正不起作用;不同进化特征的引入产生的相互抵消作用;Ks饱和导致的评估不稳定。当使用Ka评估值对基因进行排序的时候,发现快进化和慢进化基因属于不同的功能分类,具有物种或者分支特异性。我们识别了两类不同功能的免疫系统中的基因:快进化基因编码信号转导蛋白,如受体、配体、细胞因子、分化群等;慢进化基因编码功能调控蛋白,如激酶和衔接蛋白。我们的结果表明三大哺乳动物分支有其进化功能的特异性。灵长类:感觉知觉和瘤形成;大型哺乳动物:生殖和激素调节;啮齿类:免疫和血管收缩素。这些结果表明Ka计算可以较好的用作排序基因的进化速率和定义不同分支和组合的共同的功能。内含子是真核基因组的重要组成部分,关于它的功能和受到何种程度的自然选择作用的争论一直在延续。本研究中,我们发现了在哺乳动物中编码蛋白的内含子长度存在双峰分布的现象,通过研究小内含子(50nt-150nt)在基因上的分布,发现绝大多数物种过半的含有小内含子基因只含有一个小内含子;小内含子在靠近5’末端和靠近3’末端都有分布,含有靠近3’末端的小内含子的基因要更多一些。此外,发现原始哺乳动物与其它哺乳动物在小内含子进化特征上的差别,提示小内含子的保守机制可能是哺乳动物这一支特有的。我们通过分析千人基因组计划的三个群体的179个重测序的个体基因组的插入缺失多态性数据,不仅验证了人类群体中的小内含子是受到自然选择的作用,而且发现了两种主要效应。尺寸效应:长度为88nt-124nt的小内含子要比长度为50nt-86nt的小内含子具有较高的缺失/插入比值。GC效应:GC含量较低的小内含子倾向于更频繁的发生缺失。小内含子的GC含量要比其两侧外显子的高,与此相反,较大的内含子的GC含量比其两侧外显子低。我们进一步发现这两种效应可以在某种程度上区分但是不能完全独立存在。我们验证了小内含子保持接近合适的尺寸和GC含量的突变动力学机制,这些观察表明人的小内含子在转录过程和基因调控等方面可能具有潜在的重要功能。
其他文献
生成性学习是学习者主动参与的学习,通过主动建构知识,实现对事物意义的生成,是“通过个人消化的学习”。数学生成性学习是生成性学习理念在数学学科上的具体应用,高中数学生成性学习强调高中生自主建立数学知识间的关联,生成对数学知识内在逻辑意义的理解,并进一步发散性地创生,对高中生数学高阶思维的发展及数学核心素养的培养有重要意义。本文从生成性学习这一概念出发,结合学生数学学习心理和高中数学学科特点,界定数学
在我国实施新的一轮课程改革之后,我国初中数学教材中的“阅读材料”的数量明显较改革之前增加了。这些阅读材料内容丰富,蕴藏着重要的教育价值,为数学教材注入了新的生机。所以,研究这些“阅读材料”很有必要且具有意义。为了提高一线的数学教师在数学教学中以及学生数学学习中对这些“阅读材料”的有效运用,本研究以苏科版初中数学教材为例,研究初中数学教材中的“阅读材料”。首先,在以往有关“阅读材料”理论基础之上,对
教学的定义是以课程内容为中介的师生双方教与学的共同活动,所以在教师的教以及学生的学这两个方面,都应该借鉴参考一些先进理论,将理论结合实践,从而达到让教学活动更加富有科学性的效果。高中数学中最为重要的章节就包括圆锥曲线这部分内容,该内容是将代数和几何进行结合,突出用代数的方法去解决几何问题。这样一来,对学生的空间思维能力、逻辑推理能力、数学运算能力以及抽象能力的培养都起着至关重要的作用。笔者根据圆锥
教育公平问题日渐成为社会关注的重点和焦点,而男女教育机会平等作为教育机会平等的内容之一,也得到社会的广泛重视。中小学是学生构架性别观念的主要时期,教科书作为学生接触最多的文化媒介,它在学生性别角色社会化进程中起着不能不注意的隐蔽教化作用,对学生的身心健康成长有着极大的影响。我国许多研究专家从性别角度来探究教科书中的性别差异,取得了丰硕的成果,但是这些研究较偏向于对文科类教科书的研究,对理科类教科书
学位
世界各国数学课程改革中都在关注数学建模,作为数学教师,我们有必要了解学生的数学建模能力现状及其影响因素,国内外皆有学者指出元认知是影响数学建模能力的重要因素之一。本研究通过实证研究的方式,探讨数学元认知与数学建模能力的关系,检验数学元认知是否能够影响数学建模能力的发展。本文主要进行了以下研究:通过文献综述梳理了相关的理论研究,界定数学元认知与数学建模能力的概念。编制数学元认知调查问卷和数学建模能力
函数是贯穿高中数学课程的主线,对数函数作为基本函数之一,是高中数学的重难点,教师的“教”与学生的“学”两方面都有一定的难度。杜宾斯基的APOS理论不仅指出了学生的学习过程是建构的,而且还表明了建构的层次,并为数学教师如何进行数学教学提供了一种具体的教学策略。因此,进行基于APOS理论的对数函数的教学设计,可以丰富对数函数的教学研究;有利于对数函数方面的教学;通过教学设计的实施可以检验APOS理论对
平面设计是设计师通过对文字、图形、色彩、版式的重新定义,让其具有新的意义。设计师透过这种方式,传达出想要传达的讯息,具有很强的个人色彩。在平面设计领域中,字体不仅是信息传达的重要媒介,也是视觉传达的重要因素之一。文字是人们在生活中传达信息的媒介,而字体设计也是平面设计中不可或缺的一部分。本文主要探讨了平面设计中字体设计的原则及字体设计在平面设计中的应用。
转录区域是基因组中存储遗传信息的主要区域之一,其核酸组分的特征常常表现为碱基含量的不平衡,是基因组学研究中的重要研究方向之一。核酸组分的不均衡的一个重要特征是GC含量由基因的5’端向3’端先升高后降低的梯度分布现象,称为GCgradient。 GC gradient存在于单子叶植物中,但不存在于双子叶植物中,其形成与转录偶联突变有关。在细菌和后生动物中是否存在GC gradient,其形成是否也与
作为一个新兴的研究领域,生物信息学为基因分布规律和相互作用规律的研究开拓了新的空间。不同世系(如脊椎动物和节肢动物)的动物基因有序地、有组织地融入到动态染色体结构,这些结构代表身体发育和细胞分化的主要调控机制。在对动物群内和群之间的基因组进行评估时,基因组中大多数基因实际上是群集的,这是在不同阶段的渐进式稳定,具有生物学意义。直到现在,很多关于基因组织的问题,如在一个群集(簇)中基因数目最小是多少