论文部分内容阅读
在遗传信息流中,对于大多数真核基因的表达,核pre-mRNA的剪接是一个复杂的过程。绝大多数的剪接过程是由剪接体复合物催化的,除了不同的snRNAs,它还包括几百种不同的蛋白质。剪接体识别内含子三个序列单元:5’剪接位点,分支位点(BPS)和3’剪接位点上游的多聚嘧啶。剪接体催化两步连续的转酯反应,切除内含子,连接外显子。在第一步反应中,分支位点的腺苷酸的2’-OH攻击5’剪接位点,产生一个有分支的内含子和在外显子的上游末端自由的3’-OH;在第二步反应中,自由的3’-OH攻击3’剪接位点,释放有分支的内含子,同时连接两个外显子。
血红蛋白(hemoglobin)是所有蛋白质中结构与功能的关系研究得最为清楚的蛋白质之一。对血红蛋白基因内含子的研究发现,除了内含子剪接必需的序列单元,还发现在内含子的剪接过程中,pre-mRNA的结构对内含子的剪接也有一定的影响。在体内,由于pre-mRNAs总是和蛋白质结合的,裸露的RNA特别容易降解,在现在的试验条件下,很困难去萃取、提纯和结晶RNA。迄今为止,通过X-晶体衍射或核磁共振(NMR)未测定全长的pre-mRNAs,在体内更困难测定RNA的结构。在当今RNA结构分析中,理论预测和模拟起着日趋重要的作用。自1970年以来,对于RNA二级结构,发展了多种算法。尽管对于短的序列已经达到很高的精确度,但对于长的RNAs二级结构的预测仍不太理想。在缺少试验数据的情况下,不可能去评价、认同和丢弃无数复杂的算法和程序,依靠它来做进一步的研究是很困难的。不同的试验证明RNA二级结构影响剪接过程。
对于序列、结构、功能和医学背景,血红蛋白基因是研究得最清楚的基因之一,但对于pre-mRNA的折叠和剪接机制还是不清楚。建立了动态延伸折叠的方法来模拟人10个血红蛋白pre-mRNA的折叠结构。这种方法允许统计分析pre-mRNA折叠结构中的motif的稳定性。根据动态延伸折叠的结果,在序列和结构水平总结了剪接位点的序列和结构特征,采用权重矩阵计分算法检测了剪接信号和噪音,发现14个干扰的5’剪接位点和108个干扰的3’剪接位点。在某种意义上,外显子连接的再折叠,加入了共转录折叠和剪接作用。我们得出这样的结论,人血红蛋白pre-mRNAs折叠成稳定的框架结构;对于剪接位点的精确识别,剪接的顺式作用元件起复杂的作用:去除内含子,导致与内含子配对区的外显子重新折叠,同时,其它区域的结构大部分被保留。对于mRNA的折叠结构和剪接机制,本工作提供了新的观点,并为进一步的探索做了铺垫。在动态延伸折叠的模拟过程中,发现了一些保守的发夹,尽管这些发夹在剪接过程中的确切生物学作用还不清楚。对真核小基因的剪接机制,本研究提供了新的观点。动态延伸折叠的方法可以近似模拟真核小基因的剪接过程。