论文部分内容阅读
mRNA在介导细胞遗传信息由DNA编码的基因转化为功能蛋白的过程中起关键作用。本研究工作从IntegratedSequence-StructureDatabase(ISSD)数据库收集到来源于原核生物和真核生物的289个mRNA样本,运用RNAstructureversion4.1程序在计算机上模拟其转录折叠过程。模拟结果经统计分析后发现,mRNA在动态折叠过程中自始至终出现一类特殊的折叠结构元素,我们将之定义为“共有发夹”。在确保“共有发夹”统计结果可靠性的基础上,我们从所试验的不同步长递增、随机递增等各种方法中,选取在耗时和效率上都更具优势的从90nt开始,以30nt等步长递增的方法来模拟mRNA转录动态折叠过程。在此过程中出现的mRNA“共有发夹”具有能量较低、相对稳定地存在于动态变化的每一个折叠单元中的特点。基于我们的“共有发夹”统计模型(1)~(4)式共计找出1069个“共有发夹”,约占发夹总数9815个的10.89%。对“共有发夹”的进一步分析显示,结构相对稳定的这些mRNA“共有发夹”自身仍是“振荡涨落”的,但其端环和邻接端环的螺旋区域则保持稳定的拓扑学结构,变化部分主要出现在其它环区和远离端环的螺旋区域。原核生物中的mRNA“共有发夹”及其“振荡涨落”特征与真核生物中的类似,这些统计结果表明它们的存在是生物体中的一种普遍现象。
预测得到的mRNA折叠二级结构图仅仅只是罗列了mRNA的配对信息和原子间的连接关系,而这样的平面结构不仅不能表述mRNA分子的几何特征,也不足以了解mRNA分子的生物学功能。实际的mRNA分子(3D结构)中包含有更多的信息。为此,我们基于增长缓慢的RNA发夹结构数据库,创建了一套新的系统方法,用于对RNA发夹的构象变化进行评估、预测和分析。这一方法以核酸骨架构象的简化表示为基础,通过计算检验集中基于实验测定的RNA发夹的赝二面角、核苷酸的扭转角,并测定相邻核苷酸间P原子的间距,从而得到每一个RNA发夹从二维水平表示RNA分子3D发夹结构的构象。随后对训练集中的mRNA“共有发夹”进行训练(探测),最终建立了包含检验集和训练集的共计1024个mRNA发夹组成的“智能化”结构探针集。这些“智能化”结构探针能够快速、直观化、可视化地探测未知折叠结构的mRNA分子中与之2D拓扑特征相同或相似的发夹的3D结构特征,此方法已经成功地应用于我们预测和研究某些成熟mRNA片段折叠结构的3D结构特征。尤其令人惊奇的是,我们发现这些mRNA发夹结构在翻译过程中起着尚不为人所知的作用。我们先前的分析显示,mRNA茎环结构与其编码蛋白质二级结构之间存在统计相关性。对RNA发夹结构与其编码蛋白质二级结构单元之间多层次的结构相关性分析也正在进行中。我们在结构探测过程中还看到:对编码区mRNA分子构象在2D水平上的严格评估可用于对应蛋白质在同一水平上的结构分析和建模。因此,一个重要而又可能被忽视的问题——mRNA发夹及其解折叠的链构象特征在基因表达与调控过程的作用——在我们的研究中已渐渐得到揭示。