论文部分内容阅读
RNA编辑和可变剪接是两种重要的转录后调控事件,有关RNA编辑和可变剪接的研究是功能基因组时代的重要前沿问题之一。本文主要围绕RNA编辑位点和可变剪接事件的识别这一问题开展研究,主要包括下面两部分内容:首先,使用黑猩猩转录组测序(RNA-Seq)数据识别RNA编辑位点。通过RNA-Seq序列与基因组序列的比对信息发现RNA-DNA错配位点,并构建编辑位点候选集。从中滤除基因组测序质量低的位点、单核苷酸多态性位点、随机测序错误等干扰,得到8334个RNA编辑位点。选取落在已知基因上的编辑位点进行生物学功能分析,并分析编辑位点上下游序列的特征。其次,本文使用果蝇RNA-Seq数据识别剪接位点和可变剪接事件。使用TopHat软件成功识别出39718个果蝇剪接位点,其中10584个新剪接位点。基于剪接位点的不同组合,针对各类型可变剪接特征开发出计算识别算法,成功应用于可变供体位点、可变受体位点、内含子保留和外显子缺失四种可变剪接类型。最终识别出8477个可变剪接事件,其中新可变剪接事件3922个。RT-PCR(Reverse transcription polymerasechain reaction)实验验证了2个果蝇基因上新识别的可变剪接事件,发现了全新的剪接异构体。本文基于RNA-Seq数据识别到大量的RNA编辑位点和新的可变剪接事件,为进一步了解RNA编辑和可变剪接的机制提供数据支持。