基因组范围内RNA反式剪接分析

来源 :武汉大学 | 被引量 : 0次 | 上传用户:liuwu123123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
真核生物mRNA前体一般都包括外显子序列和内含子序列,mRNA的成熟需要对前体mRNA进行内含子剪切和外显子拼接的加工步骤。当这种加工发生在同一个mRNA前体分子时,称为顺式剪接。发生在不同mRNA前体分子的剪接称为反式剪接,这一种剪接方式并不像顺式剪接那样常见。尽管对于反式剪接这种剪接机制的研究和认识要远远的比不上顺式剪接,但是反式剪接因为其重要的理论意义和应用价值已经得到了广泛的关注。大多数基因治疗针对的都是DNA,而利用反式剪接这种机制对RNA进行基因治疗已经成为当前最有前途的基因治疗手段之一。反式剪接主要存在像椎体虫、线虫等低等真核生物中。虽然有报导在包括人等高等哺乳动物中发现存在反式剪接的现象,但是人们普遍认为,反式剪接这一种剪接机制在哺乳动物等高等生物中是非常稀少的,相对于顺式剪接所产生的转录本是可以忽略不计的。有很多研究通过生物信息方法在公共的序列数据库发现大量的嵌合体基因,但是他们认为这些嵌合体序列都是来自于染色体易位或者人工嵌合体,而不是反式剪接。随着第二代测序技术的发展,公共序列数据库中积累了大量的来源于生物体内转录本的32nt左右的短的RNA-Seq序列。本文结合EST/mRNA序列和RNA-Seq序列,在基因组的水平上预测反式剪接。通过这种方式,既能够排除人工嵌合体,同时也能够排除染色体易位,因为人工嵌合体和染色体易位偶然性比较强,同时存在于不同个体或者不同实验的概率非常低,而反式剪接作为一种剪接机制不存在这种偶然性。通过不同来源的序列的交叉验证,可以筛选具有较高可信度的反式剪接嵌合体。最近在古细菌中发现的断裂tRNA基因表明不仅mRNA可以进行反式剪接,类似tRNA这种分子也有可能进行着反式剪接。某些tRNA基因的5’端半分子和3’端半分子位于基因组的不同座位分别转录的,然后在RNA水平上进行反式剪接形成成熟的tRNA分子。本文从古细菌、真细菌以及真核生物的基因组中分析可能的断裂tRNA基因,在进化上讨论断裂tRNA基因通过反式剪接形成成熟的tRNA分子这一现象。主要研究结果如下:1、反式剪接的基因组水平分析首先利用人类和小鼠的EST/mRNA序列初步预测嵌合体EST/mRNA。在人类和小鼠中分别得到53,074和19,151条嵌合体EST/mRNA。然后通过基因组座位将冗余的嵌合体EST/mRNA去掉,最后在人类中得到45,942条非冗余的mRNA嵌合体,在小鼠中得到15,315条非冗余的mRNA嵌合体。然后利用RNA-Seq序列筛选反式剪接嵌合体。总共从人类的44228个候选嵌合体中筛选出1235条有RNA_Seq支持的嵌合体,从小鼠的14575个候选嵌合体中筛选出1129条有RNA_Seq支持的嵌合体。这些经过最终筛选得到的反式剪接嵌合体具有较明显的染色体偏好性。比如人类中的嵌合体在21号染色体上非常的丰富,而在5号、10号和14号染色体上分布的非常的少。对反式剪接可能的机制进行了初步的分析和探讨。发现大部分的反式剪接的上游转录本和下游转录本在拼接处(junction)有重叠的碱基(human:77%; mouse:76%),称之为重叠拼接(overlapped junction);只有极少部分的反式剪接的上游转录本和下游转录本是恰好拼接而形成嵌合体(human:5%; mouse: 7%),称之为精确拼接(exact junction);另外还存在一部分反式剪接在拼接处有一段序列既不存在于上游转录本,也不存在于下游转录本(human:18%;mouse: 17%),我们将这种拼接方式称为缺失拼接(gapped junction)。我们检测了反式剪接形成的嵌合体是否编码新的嵌合体蛋白。在人类中有64%的反式剪接嵌合体能够编码新的蛋白,在小鼠中有66%的反式剪接嵌合体能够编码新的蛋白。这表明,反式剪接跟选择性剪接一样,对蛋白质组的多样性有很大的贡献。同时对参与反式剪接的基因进行了功能注释。人类的核糖体蛋白(ribosomal protein)、核酸结合(nucleic acid binding)以及细胞骨架蛋白等分子功能的基因更加倾向于发生反式剪接,而受体分子等分子功能的基因发生反式剪接的比较少;在小鼠中钙粘蛋白、细胞粘着分子以及氧化还原酶等分子功能的基因比较倾向于发生反式剪接,受体分子等分子功能的基因比较少见发生反式剪接。本研究还分析了染色体相互作用与反式剪接的关系。首先染色体之内的反式剪接要比染色体间的反式剪接明显要多。同一条染色体在空间上比不同的染色体在空间上更接近,更容易发生相互作用。因此染色体的相互作用有利于发生反式剪接。进一步利用Hi-C数据验证了这个观点。分别在人类和小鼠中选取部分预测得到的反式剪接进行PCR验证,证实了其中一部分反式剪接的存在。最后将预测得到的反式剪接数据导入Mysql数据库,并用PHP开发出一个动态网站TRSDB展示反式剪接的结果。可以通过TRSDB浏览每一个反式剪接的具体信息,包括染色体定位、参与反式剪接的基因注释、剪接方式等。还可以通过基因名字、基因ID或者accession号码在TRSDB中搜索反式剪接。2. tRNA的进化:从断裂基因到连续基因首先发现从低等的古细菌到高等的人类、小鼠等脊椎动物,tRNA基因的基因组上下游都呈现出保守的单核苷酸替代模式:越靠近tRNA基因单核苷酸替代越富集。这一模式与缺失/插入一致,表明tRNA基因可能来源于缺失/插入。为了进一步得到tRNA基因是来源于缺失/插入的证据,分析了脊椎动物和昆虫的进化历史,分别在脊椎动物的基因组多序列比对中和昆虫的基因组多序列比对中找到18例和5例tRNA基因的缺失插入。通过同源搜索方法证实了tRNA半分子同源序列在大量物种的基因组中普遍存在。然后通过分析tRNA基因的方法分析tRNA半分子同源序列的上下游基因组的单核苷酸替代频率,发现tRNA半分子同源序列附近的单核苷酸替代并不像tRNA基因附近的单核苷酸替代那样富集,表明在现在的基因组中,tRNA半分子同源序列没有tRNA基因活跃。还发现tRNA半分子同源序列与逆转座元件相关。在小鼠和人类中用CAGE标签检测到tRNA半分子同源序列的表达,并在小鼠中用RT-PCR进一步验证。以上结果表明tRNA半分子基因要比tRNA基因古老,tRNA半分子同源序列可能是tRNA半分子基因的进化痕迹,tRNA半分子基因具有逆转座的功能,在RNA水平上形成完整tRNA分子,通过逆转座插入到基因组,然后进化成完整的tRNA基因。
其他文献
1病例资料林某,女性,58岁,主因“右侧脸颊部剧烈疼痛间作15d加重3d”,于2012年6月12日入院。患者于半月前无明显诱因右侧面颊部剧烈疼痛,疼痛持续数秒或数分钟不等可自行缓解,尤以
<正> 克莱德曼的音乐是美的,但更是流行化的、通俗的商业产品,他的音乐是典型的消闲音乐,背景音乐。这些音乐的艺术价值远远不能与古典音乐大师们的作品相提并论。最重要的是
古文字学中的货币文字,是指在货币上铸成的关于面值、地名等方面内容的文字。本文对战国文字中,铸在货币上的数字文字的特点做了探讨,包括以下三个方面的内容:战国货币文字的
目的研究孕妇生殖道B族链球菌感染对母婴预后的影响,提高临床对孕妇生殖道B族链球菌感染的认识。方法选取2011年1月-2013年1月入院待产的孕妇350例,所有孕妇于孕36~38周,取阴
目的:研究金樱子Rosa laevigataMichx.果实的化学成分。方法:运用正反相硅胶,凝胶(Sephadex LH-20)等多种柱色谱进行分离纯化,根据理化性质和波谱数据进行结构鉴定。结果:分
随着全球计算机系统处理的信息数量不断增长,数据质量成为业界十分关注的问题。数据质量是一个多维概念,它既依赖于消费者的需求,又需要符合公司或组织设定的标准。正是因为
目的 :为聚维酮碘在医院的推广使用提供一定理论基础。方法 :参考有关文献资料 ,对聚维酮碘的结构特性、作用特性、对微生物的杀灭机理、灭菌谱、应用等方面进行综述。结果与
<正>产后尿潴留是产科常见并发症,给产妇带来痛苦,并造成一定的心理压力。以往常用导尿术解除尿潴留,但常有不同程度的尿路感染,给产妇再次带来痛苦。我院自2003年至今试用开
目的:观察盐酸曲美他嗪、复方丹参滴丸联合治疗对慢性收缩性心力衰竭患者心功能的影响。方法:80例心力衰竭患者随机分为对照组40例和观察组40例,对照组予ACEI类(或ARB类)、β
本研究用根管充填剂(上海第二医科大生产)根管治疗乳牙牙髓病及根尖周病65颗,干髓治疗乳牙牙髓病65颗,空管药物治疗乳牙牙髓病及根尖周病186颗,治疗后随访1-5年,结果表明根管