基于新一代测序的数字基因表达谱生物信息学分析平台的建立及应用

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:Iknowyou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新一代测序技术具有高通量、低成本等优势,在动物和植物的基因组测序及基因表达研究中被广泛应用。棉花不仅是一种重要的经济作物,其纤维细胞也是理想的研究植物细胞生长发育的模型。但由于其基因组较大、多倍性等原因,全基因组的测序及拼接工作难度较大。因此,为了解读基因的功能,更好的研究基因在棉花生理代谢活动中的作用,利用新一代测序技术对棉花基因表达进行研究已成为近些年来的研究热点。然而如何利用生物信息学工具从新一代测序产生的海量数据中挖掘有效的信息,成为目前急需解决的问题。据此本研究建立了一个基于新一代测序的数字基因表达谱生物信息学分析平台,并应用于棉花RNA测序数据。此分析平台的流程包括对测序原始数据的预处理,与参考序列的比对,基因表达量和测序覆盖度的统计,对多个样本的基因表达差异分析以及后续的功能注释和代谢通路分析。然后应用此分析平台,对陆地棉YZ1正常株系和PDF1基因RNAi株系开花当天的胚珠RNA测序数据,共四个样本(DF1-DF4),进行了全面的分析。主要的研究结果如下:1.分析平台的建立:利用FASTX-Toolkit对测序原始数据进行质量控制,去掉低质量的序列后得到待分析数据(clean reads),接着利用Maq和Bowtie将clean reads比对到参考序列上,并编写python脚本统计RPKM值和测序覆盖度,合并多个样本的比对统计值之后利用DESeq进行差异表达分析,最后将差异表达的基因利用Blast2GO进行GO功能注释,WEGO进行功能分类统计,KEGG进行代谢通路分析。2.成功应用于DF1-DF4四个样本的测序数据分析:对DF1-DF4进行质量处理后,均保留了99.6%的数据;比对到参考序列上的基因,其RPKM值小于100的分别占了92.2%,91.7%,91.7%,91.0%;DF1与DF2进行水平内去除差异后,与DF3的比较得到27个差异表达基因,其中23个上调表达,4个下调表达;与DF4的比较得到345个差异表达基因,其中51个上调表达,294个下调表达;前者获得52个GO注释和9个KO注释,后者获得142个GO注释和112个KO注释。本研究所建立的表达谱分析平台通过对棉花RNA测序数据的应用及结果展示,显示了其可行性,为以后大规模基因表达分析奠定了良好的基础。
其他文献
海德里希·冯·克莱斯特(HeinrichvonKleist,1777-1811)是德国文学史上的经典作家。相比于同时代其他作家,克莱斯特以先觉者的身份洞察到了现代社会观念层面的困惑与纠结,并
正当南京繁花似锦、春意盎然的时节,经过多年建设的江苏省方志馆终于落成开馆了。这是江苏省文化建设事业的一件大事,也是全国方志界的一件喜事,更是江苏省方志办为保护利用
压缩图像超分辨率重建是指通过一定技术从低分辨率的压缩图像中获得高分辨率的清晰图像的技术,它能够恢复出图像在压缩过程中丢失的细节信息,并且去除压缩图像中明显的人工痕
本文主要是论述在医学文检双语教学中如何利用申农-韦弗模式、兰开斯特模式、施拉姆模式等,以便达到最好的信息交流与医学文检双语教学效果。
提高学生的综合素质,培养高水平的医学人才,已成为医学教育改革的一项重要内容。根据组织学与胚胎学实验课特点,通过开展实验技能和科研培训、重视对学生的人文医学教育、改革教
防浪墙混凝土施工一般采用常规钢模板或拼装大模板,但对于高墙薄壁型防浪墙采用常规方法施工,不仅难度大,成本高,而且工期质量难以得到保证,安全风险也大。介绍新疆吉林台一级水电
乾隆三十八年(1773)二月,乾隆帝诏开四库全书馆,编纂《四库全书》。乾隆四十七年,清高宗下谕续缮三份《四库全书》,分别藏于扬州文汇阁、镇江文宗阁、杭州文澜阁,这就是《四库全书》
在重庆江滨、河滩等地带进行建筑工程人工挖孔桩基础施工,常会遇到地下水丰富、流砂层、淤泥较厚等的情况,因而极易造成孔内渗水、涌砂和孔壁坍塌成孔较困难。该文对重庆地区
近年来,随着施工升降机的广泛应用,施工升降机防护层门的安全问题也越来越得到重视,结构设计的不合理及人为疏忽等原因导致的安全事故频频发生。为了从源头上减少事故的发生,
研究背景与目的:4.5小时内接受阿替普酶静脉溶栓治疗是急性脑梗死患者实现早期开通血管的最有效的治疗方案,但有效率只有30%左右。他汀类药物在一些随机对照试验中证实了可以