基于新一代测序数据的非编码RNA基因的系统挖掘

来源 :中山大学 | 被引量 : 0次 | 上传用户:ulvme2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非编码RNA(ncRNA)是一类以RNA形式行使功能的非蛋白编码的RNA,在细胞的生长、分化和死亡以及癌症和肿瘤的发生和发展等方面发挥重要作用。能够快速测定数百万条标签序列的新一代高通量测序技术的应用已经改变了RNA组学研究的景观。然而对这些海量数据进行探测以及在其中鉴定新或新类的非编码RNA是一项令人畏惧的挑战。   本研究中,我们开发了一个新的数据库-deepBase,对转录组数据进行全面的注释并发现新的小分子RNA。当前版本的deepBase数据库包含了来自七个物种不同组织和细胞系的185个小分子RNA文库的深度测序数据,这七个物种分别是:人、小鼠、鸡、玻璃海鞘、黑腹果蝇、秀丽线虫和拟南芥。通过对约1460万条可以与超过2.84亿个基因组位点完美匹配的测序序列的分析,我们注释和鉴定了约38万个非编码RNA相关的小分子RNA(nasRNA)、约150万个启动子相关的小分子RNA(pasRNA)、约400万个外显子相关的小分子RNA(easRNA)和月600万个重复元件相关的小分子RNA(rasRNA)。而且,我们还利用miRDeep和snoSeeker预测出了2038个miRNA候选分子和1889个snoRNA候选分子。所有比对后的测序序列可以归为大约120万个RNA簇。为了便于进行比较分析,deepBase提供了一个综合性的、交互式的和多样化的显示方式,同时还提供了便捷型的搜索功能、相关的参考文献和其它有用的信息以便于进一步的研究。用户可以登录http://deepbase.sysu.edu.cn/网站使用deepBase高通量测序数据分析平台。   虽然高通量测序技术极大地有助于转录组的研究,但是缺乏分析这些数据的有效工具是当前主要的瓶颈。本研究,我们开发了一个deepView基因组浏览器可视化和分析高通量测序数据。deepView可以可视化浏览基因组序列、注释、变异,小RNA的表达模式和表达丰度。同时,我们开发了一个整合的软件系统maNGS分析深度测序数据和鉴定小非编码RNA。maNGS包含了一个新的软件miRNGS,提升版的snoSeekerNGS和一系列的计算机工具。运用它们,我们能够从高通量测序数据中特异地鉴定micmRNA,snoRNA和其他的小非编码RNA,如nasRNA,pasRNA,easRNA和rasRNA。
其他文献
党委办公厅(室)工作是党的工作的重要组成部分,位置重要,责任重大,更要做讲政治的表率。做讲政治的表率,就要坚定不移地同以江泽民同志为核心的党中央保持高度一致。这是对
美国文昌鱼全基因组草图的发布,表明文昌鱼是最古老的脊索动物,它的基因组最大程度保留了脊椎动物祖先基因组的特征,因此文昌鱼成为研究免疫系统起源和演化的关键所在。前期
学位
为了保障我国乃至全球转基因产品标识管理制度的顺利实施,本文主要从两个方面开展了转基因产品检测技术的相关研究。 转基因玉米3272品系特异性检测方法的建立:基于转基因玉