论文部分内容阅读
固有无序蛋白质(Intrinsic disordered proteins,IDPs)是指缺乏特定的三维结构的蛋白质,其折叠结构随环境或配体的变化而变化。在生命体中,特别是真核生物中广泛存在着固有无序蛋白质,它们参与重要的信号转导、生物调控等过程并且常在蛋白质相互作用网络中处于枢纽地位。蛋白质结构域是蛋白内结构、功能和进化的基本单位,通常具有稳定三维结构,然而部分结构域在自然状态下以无序状态存在。以往的研究中,对于无序蛋白质的功能已有较多的研究,但对于无序结构域在物种中分布情况及其功能特征,尚无系统全面的研究。因此,本研究首先重点关注了无序结构域在古细菌、细菌和真核生物三大域共1870个代表物种中的分布情况及其功能意义。相比于古细菌和细菌,真核生物中含有更高比例的无序结构域。物种内无序结构域的含量与物种复杂性间存在显著的正相关性。但也存在异常现象,如:嗜盐菌等低复杂性物种中也含有较高比例的无序结构域;同线虫纲相比,子囊孢菌门各物种虽生物复杂性较低,但含有更高比例的无序结构域。这提示,物种内无序结构域的比例不仅与物种复杂性有关,还与特定进化分支所出现的特殊功能有关。那么,为什么各物种内无序结构域的比例会出现较大差异呢?这可能与蛋白质结构域在进化过程中的两方面原因有关。首先,某些谱系特异的结构域(只出现在某一进化分支的物种中的结构域)更倾向于无序,导致这些物种中(特别是高等真核生物中)无序结构域的比例更高。其次,在进化过程中,一些共有结构域(在不同界甚至不同域的各物种中广泛出现的结构域)在不同进化分支其无序性发生改变,即同一结构域在不同物种中可能具有显著不同的结构域无序率(Domain structural disorder ratio,DSDR)。从功能角度来看,原核生物和真核生物中的无序结构域分别执行不同类型的生物学功能。原核生物中含无序结构域的蛋白倾向于定位于核糖体和细胞质,主要参与大分子的合成和代谢等生物过程。在真核生物中,含无序结构域的蛋白倾向定位于细胞核,主要参与多种调控过程,包括基因表达调控、入核转运、RNA剪接、染色体装和细胞骨架组装等生物过程。无序结构域的功能主要受结构域年龄和无序范围(共有结构域在不同物种中具有不同无序性,其中无序共有结构域所占物种的比例)的影响。此外,我们发现后生动物和真菌中的无序结构域具有不同的无序特征倾向性。后生动物倾向含有更多高无序率但不含连续无序区域(CDR)的无序结构域;而真菌倾向含有更多低无序率但含有CDR的无序结构域。这种现象可能和它们不同的功能需求有关系。固有无序蛋白质在不同OTCs中呈广泛表达,但丰度一般不高。在不同发育时相中,固有无序蛋白质受到优先充分利用。固有无序蛋白质的广泛表达及优先充分利用表达特征反映了它在发育过程中及成体OTCs中所发挥的重要作用。固有无序蛋白质的功能多样,通常参与调控相关生物过程。因此,各生命系统对它的需求量较大。总的来说,固有无序蛋白具有灵活多变的构象特征,倾向于参与生物学调控和信号转导等重要功能。固有无序是一种独特的结构特征,它使固有无序蛋白拥有更多相互作用伴侣蛋白,参与形成多样的相互作用。由于它们是细胞过程的重要调控者,所以它们本身受到严格的调控。当固有无序蛋白发生错误修饰、错误翻译或表达异常时,通常会形成混杂的相互作用。这与癌症、精神疾病、神经退行性疾病、心血管疾病及糖尿病等多种疾病的发生有关系。本文重点关注无序蛋白在癌症和精神疾病发生中的作用。基因组学技术的进步使人们对于癌症的致病机制有了更加深入的认识。癌症中基因突变能够改变所编码蛋白质的无序性,可能改变蛋白原有的功能,使其参与癌症发生相关重要通路中。本研究发现,在多型癌症中,精氨酸(R)突变为色氨酸(W)或半胱氨酸(C),以及精氨酸(R)、谷氨酸(E)和谷氨酰胺(Q)位点发生无义突变的情况倾向于引起所编码蛋白无序性发生改变。探究突变对蛋白无序性的影响,为筛选新的肿瘤标记物提供了重要参考信息。弥漫型胃癌(Diffuse gastric cancer,DGC)是我国最常见的恶性肿瘤之一,死亡率较高。近年来,组学技术的进展使得DGC的致病机制得以进一步揭示,但仍未完全解决其诊断和治疗问题。因此,我们重点关注了蛋白质无序性特征与DGC发病机制的关系。我们主要从结构域数目、结构域年龄和结构域的无序率等方面探索了DGC相对于癌旁显著上调蛋白的特征。发现:固有无序蛋白质通常在DGC中表达上调,暗示其在DGC发生发展中可能发挥重要作用。DGC上调蛋白中无序蛋白SOX9与DGC发生关系已明确,但其致病机制仍未完全揭示。我们推测无序蛋白SOX9过表达后能够结合多种长链非编码RNA或其他蛋白,参与肿瘤的发生。精神疾病是一类病因不明的中枢神经系统疾病,其症状复杂,以认知、情绪、行为等方面的改变为特征,伴有痛苦体验和功能损害。然而,精神疾病发生的生物学机制在很大程度上仍是未知的。本研究基于已知精神疾病相关基因,全面探究其内在性质,能够对精神疾病相关基因的特征得到规律性认识,同时可为深入挖掘发病机制提供线索。本研究利用基于超几何分布的富集缺失分析方法确定精神疾病已知相关分子的5大类内在性质特征,基于分析结果量化人类基因组中每个蛋白质编码基因参与精神疾病发生的可能性,结合差异表达信息,筛选新的潜在相关分子。这些结果将为精神疾病的防诊治相关研究提供重要参考信息。总之,本研究针对三大域内的1870代表物种,在全蛋白质组范围内全面探究无序结构域的分布和功能特征,系统解析了无序结构域在不同物种中不均匀分布的原因。本研究首次揭示物种内无序结构域的比例与物种复杂性之间的密切关系及无序结构域对进化谱系特异性功能形成的重要意义。这些结果可丰富我们对蛋白质结构域进化和功能的规律性认识,具有重要科学意义。在此基础上,我们进一步探究固有无序蛋白质在癌症和精神疾病等疾病发生中所起的作用,为癌症和精神疾病的发病机制和靶向治疗等相关研究提供了重要参考信息。