论文部分内容阅读
基因表达是指细胞在生命过程中,把储存在DNA序列中的遗传物质经过转录和翻译,转变成具有特定生物功能与结构的蛋白质分子。简单来说,基因表达由两个过程组成:转录和翻译。基因的表达具有高度的精确性,很多生命活动,都依赖于基因的正确表达。而基因表达实际上是一个不连续爆发、随机性的过程,这些性质可以引起遗传信息上相同细胞的表型差异。因此,了解潜在的生化反应如何引起mRNA或蛋白质水平的变化对于多种细胞过程是至关重要的。最近的技术发展使得能够对细胞大分子进行单细胞测量,这可以揭示基因表达的潜在过程。相应地,需要开发理论工具来定量模拟随机基因表达及其对细胞过程的影响。鉴于基因表达本质上是随机的,细胞调节途径中调节蛋白质水平的这种内在变异性是很有必要的,特别是那些引起基因表达全局变化的那些调节因子。已经发现调控网络的中心组成部分是通过调节蛋白和细菌中的小RNA(sRNA)以及高等生物中的微小RNA(miRNA)的转录后控制。最近的研究指出,这种调节模式在微调基因表达中的噪声和调节重要的细胞过程中发挥着越来越重要的作用。在本文中,我们分析了基于sRNA参与转录后调控的基因表达模型,转录后调节在诸如发育和分化的多种细胞过程中起关键作用。模型中遗传回路受高调节剂浓度作用,调节因子的动力学行为不能被忽略,sRNA的调控作用通过与mRNA进行联合降解来实现。在这样的表达模型的基础上,我们推导出蛋白质稳态分布的准确表达式,计算和分析蛋白质水平的均值、噪声与系统的随机偏差,并重点讨论sRNA参与的转录后调控机制如何用于微调随机基因表达过程。本文的主要工作如下:(1)利用包含转录爆发机制的sRNA调控的基因表达模型,写出联合概率分布满足的化学主方程,这种调节过程中sRNA-mRNA相互作用引起的非线性以及mRNA和蛋白质的爆发式合成使得这种随机过程的精确解难以获得。在量化蛋白质噪音水平时尤其如此,这对多种细胞过程有很大影响。在具有非线性反应速率和低分子丰度的生物系统中,用平均场方法得到的结果是不准确的。在低频率的转录事件和sRNA强的作用下,我们通过合理假设得到了蛋白质稳态分布的近似表达式,根据结果预测了sRNA调控作用可以当作是对蛋白质爆发事件发生速率的修改。(2)基于之前的结果进行扩展,脱离假设条件的约束,通过概率方法得到蛋白质的爆发分布,然后利用蛋白质爆发合成近似理论推导出一个更准确的蛋白质稳态分布表达式。值得注意的是,我们的结果在一个广泛的参数范围是有效的,并且用Gillespie模拟对理论结果进行了验证。(3)根据蛋白质稳态分布,进而推导出蛋白质的稳态噪声,并用随机偏差来量化随机性引起的差异性。我们发现sRNA调节作用增大了表达噪声,降低了蛋白质表达水平。另外,调节模型中的由随机性产生的蛋白质是要多于从系统中去除随机性的情况下产生的蛋白质数量。而且,即使mRNA平均爆发大小不同,由随机性引起的蛋白质增益在相同的噪声值下也不会发生显著变化。我们从理论上解析了sRNA调控的遗传回路噪声特性和随机性引起的蛋白质水平上的差异性,该结果为更广泛的基因表达研究提供了分析工具,并加强了我们对控制基因表达过程中转录后调控的定量理解。