体内mRNA结构解链程度的解析及数据库的构建

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:xiawayu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RNA作为一种古老的、重要的生物大分子,它通过反向折叠可以形成RNA结构,从而参与更为复杂的细胞活动。随着技术的发展,多种预测算法与实验技术被用于RNA结构的解析。其中,最为革命性的是结合高通量测序技术用化学探针探测细胞内全转录组RNA的单链位点,以此在一个样本中同时获得上万条转录本的体内RNA结构。另一种技术,核糖体图谱,结合了高通量测序技术对核糖体足迹进行测序,获得了单碱基精度的体内核糖体位置。这两种技术的出现让我们分析细胞内核糖体对mRNA结构的影响成为可能。本研究首先对比了酿酒酵母体内体外RNA结构数据。采用基尼系数作为评价RNA结构强度的指标,得到了转录组体外RNA结构普遍强于体内RNA结构且非编码区的RNA结构普遍强于编码区的结论。为了衡量体内RNA结构的解链程度,我们提出了“RNA结构消失程度(DIS)”的指标。我们通过组学数据处理对每一个RNA结构提出了五种RNA结构特征,包括:RNA结构区的核糖体密度(RD)、RNA结构所在mRNA的翻译起始核糖体密度(INI)、RNA结构的相对位置(POS)、RNA结构的最小自由能(MFE)和GC含量(GC)。这五种特征与DIS指标的相关分析中,RD与DIS的正相关最强,可以初步得到核糖体密度的增高会引起体内RNA结构的解链的结论。接着,研究中将RNA结构按照DIS值分类高解链结构(HUS)和低解链结构(LUS),并采用深度学习技术建立二分类模型。通过十折交叉验证的方法最终获得了泛化性与精度较高的深度学习模型,Deep DRU。单因素梯度突变的方法被用于逐一解析各个结构特征对体内RNA结构解链程度的贡献,并计算其影响因子。我们发现翻译起始的核糖体密度对RNA结构解链的贡献最大,较高的起始核糖体密度会导致整条mRNA上解链程度的降低;其次是RNA结构区的核糖体密度,高核糖体密度由于核糖体的占位会造成mRNA结构较高的解链程度;同时,mRNA的5’端虽然具有较高的核糖体密度,但是解链程度较低。研究还发现,RNA结构的序列特征,包括通过序列计算出的最小自由能和GC含量,对体内RNA结构的贡献最低。我们还通过模型预测获得了酿酒酵母中787个具有稳定的高解链程度的区域(s HUS)和1905个稳定的低解链程度的区域(s LUS)。最后,通过对收集到的转录组RNA结构探测数据进行统计、整理并实现可视化,建立了转录组RNA结构数据库(RSVdb,https://taolab.nwsuaf.edu.cn/rsvdb)。RSVdb目前包含8个物种,178个样本,626,225个具有有效DMS活性数据的转录本。数据库不仅对RNA结构相关的测序数据重新进行了数据处理与标准化,还生成了可交互式的统计图表与报告,同时支持搜索任意RNA序列并以DMS活性值作为限制在线进行RNA结构预测和RNA结构的可交互展示。数据库还包含详细的用户手册并且提供RNA结构数据的下载。综上所述,本研究主通过结合两种组学数据,应用了深度学习技术对体内RNA结构的解链程度进行建模,充分阐述了核糖体以及其他结构特征对mRNA结构的影响,最后通过服务器与网络技术将所收集的转录组RNA结构数据进行建库并实现可视化。本研究尝试采用多组学与新技术融合的方案解决生物学问题并取得了一定进展,深化了对细胞内RNA结构影响因素的认识,为未来研究转录组RNA结构的调控提供了新的思路与数据库支持。
其他文献
原牛(Bos primigenius)大约在150-200万年前起源于南亚地区,在更新世时期扩张到亚洲、非洲北部和欧洲等地区。现在的家牛在生物学分类上可分为瘤牛和普通牛,瘤牛有瘤峰,主要分布在南亚和非洲东部地区;普通牛没有瘤峰,主要分布在欧洲、非洲和亚洲。前人研究发现,瘤牛和普通牛分离时间25-100万年前。现在普遍认为,瘤牛和普通牛各自有一个驯化起源,瘤牛在8500年前在南亚地区驯化,而普通牛的
丙酮酸激酶亚型2(PKM2)是肿瘤专有代谢类型有氧糖酵解过程的关键驱动者,除了具有代谢酶活性,其在多种肿瘤中发挥的非代谢功能也逐渐被发现,使其成为癌症研究中的热点分子之一,针对PKM2作为靶点而进行的肿瘤治疗探索在多种肿瘤类型中开展。作为代谢异常的肿瘤细胞之一,胰腺癌的有效治疗手段十分有限,病人的愈后并不理想,对其发挥重要功能的新靶点以及治疗方式的探寻对于延长胰腺癌病人的生存时间具有重要意义。目前
由苹果黑腐皮壳菌(Valsa mali)引起的苹果树腐烂病,是苹果上的一种毁灭性真菌病害。一旦病菌侵入到苹果树枝干的韧皮部和木质部,生产上只能利用外科手术及化学药剂进行防治,但是化学药剂由于很难达到树皮和树干深层,无法很好的控制病害,从而导致生产上严重的产量和经济损失。因此,解析苹果黑腐皮壳菌的致病机制对于开发新的腐烂病防治策略具有重要意义。病原菌通过G蛋白所调控的cAMP/PKA(the cyc
维生素C(Vitamin C,VitC)是人和动物必需的营养物质。科学界对于VitC功能几乎所有的认识都基于它作为电子供体,即作为天然还原剂的化学性质,主要表现在VitC能够清除细胞代谢过程中产生的活性氧自由基(reactive oxygen species,ROS),保护重要的生物大分子免于氧化损伤,维持细胞的正常功能。对VitC研究的一次重大突破,在于发现VitC是亚铁离子(ferrous i
随着人工核酸内切酶的不断研发和改进,位点特异性基因编辑逐渐成为多个物种各研究领域的热门技术。近年来,源于酿脓链球菌的Cas9蛋白(SpCas9)由于其高效率、多功能和便于操作等特点已经成为最受欢迎的RNA介导的核酸内切酶(RGEN),广泛应用于各物种基因组靶位点修饰相关研究中。尽管CRISPR/Cas系统已经公认具有较高的靶位点编辑活性,但是这项技术造成的相对较高的脱靶突变率仍然是影响应用效果和范
混凝土结构常常在不同的水压力环境中服役,一类混凝土结构所处服役环境的水压力较小,如浪溅、降雨以及低水头浸泡等,可视为无压水环境;另一类混凝土结构所处的水环境压力较高,如高坝的局部(坝踵部位),该服役环境的水压力不可忽略,为高压水环境。不同水压力环境下的混凝土受湿度和孔隙水压力的共同作用,且力学特性存在显著差异,本文基于物理试验和细观力学理论,系统研究了混凝土在无压水和高压水环境下的力学特性变化规律
植物在整个生命过程中会面对各种限制其生长和发育的胁迫因子,其中干旱是影响植物生产的重要限制因子,活性氧(Reactive oxygen species,ROS)的产生是植物应对逆境的普遍特征,而NADPH氧化酶(NADPH oxidases,NOXs)被认为是植物在正常和胁迫环境下ROS产生的关键酶。植物NOX在不同的亚家族之间具有不同的功能,对这些亚家族基因的研究发现它们在基因结构上呈现出了明显
片角叶蝉亚科Idiocerinae隶属于昆虫纲Insecta半翅目Hemiptera,全世界已知112属近800种,片角叶蝉亚科昆虫广泛分布于世界各大动物地理区,是最大的树栖叶蝉类群;多个种类是重要的经济害虫。亚太地区片角叶蝉昆虫区系分布丰富,但一直缺乏全面系统的研究。本论文对亚太地区片角叶蝉亚科昆虫进行了初步系统分类研究。文中综述了世界片角叶蝉亚科的研究概况,详细介绍了片角叶蝉亚科的形态特征。利
我国是世界苹果第一生产大国,栽培面积和产量均占世界总量的一半以上。黄土高原地区是我国苹果的优生区和主产区,但由于该地区年降雨较少,蒸发量大,土壤盐渍化问题严重;此外,随着全球变暖,极端高温现象频繁出现,盐和高温胁迫是该区苹果产业面临的两个重要逆境问题。自噬是一个在真核生物中高度保守的细胞内大分子降解过程,其在植物细胞内的活性能够被多种非生物胁迫诱导。本课题组前期研究表明,自噬在苹果响应干旱及低氮中
本文是亚太地区广头叶蝉亚科的系统分类研究论文。论文第一部分对亚太地区广头叶蝉亚科的分类研究概况作了全面综述;对该亚科的族、属级单元进行了梳理;基于形态学和分子生物学数据,分别进行了系统发育分析。第二部分简要介绍了本研究所用的材料与方法;规范了广头叶蝉分类中常用的形态学术语;介绍了该亚科的生物学特性及经济重要性;对该类群的地理分布情况作了简要综述和分析。在第三部分,对亚太地区广头叶蝉亚科区系作了初步