论文部分内容阅读
目的:以五年生人参根、茎、叶为研究对象,利用高通量测序技术构建人参转录组数据库并筛选人参根与茎、叶差异表达基因,为进一步发现人参功能基因,阐明人参药效物质,选育优良品种等提供理论基础。方法:运用改良的Trizol法分别提取人参根、茎、叶总RNA,并采用琼脂糖凝胶非变性电泳及Agilent2100Bioanalyzer对其进行检测。利用Illumina HiSeq2000系统进行转录组测序,使用Trinity软件做转录组从头组装,组装得到的序列使用Tgicl去冗余并进一步拼接,通过同源转录本聚类,得到最终的Unigenes。不同样品得到的序列用聚类软件继续做拼接、去繁冗、并同源转录本聚类,最终得到不能再延长的非冗余All-Unigenes。将非冗余Unigenes与nr、Swiss-Prot、KEGG和COG数据库做blastx比对(E value<10-5),取比对结果最好的蛋白确定最终的序列方向,获得基因注释信息,功能类别以及代谢通路等。同以上数据库均比对不上的Unigene用ESTScan软件确定序列的方向。根据数据库中基因表达量(FPKM值)筛选根、茎、叶高表达基因,根据基因表达量比值倍数的关系筛选根与茎、叶差异表达基因及非差异表达基因。采用q-PCR方法对转录组数据库进行验证。结果:1、改良Trizol法提取人参根、茎、叶总RNA,经琼脂糖凝胶电泳检测28S、18S条带清晰,亮度比例接近2倍;Agilent Technologies2100Bioanalyzer检测O.D260/280在1.8~2.2之间,O.D260/230大于1.8,RIN>6.5,RNA总量>20μg,RNA符合建库标准。2、运用HiSeq2000测序平台,双末端测序技术对序列进行拼接、去冗余后,每个样品平均获得4千多万条高质量的短序列。经序列组装,人参根、茎、叶分别获得53,870,69,591,66,045条Unigenes;序列平均长度分别是553nt,686nt,644nt。在All-Unigenes中获得73,434条Unigenes,平均长度为877nt。3、通过与NCBI蛋白质数据做blastx比对,根、茎、叶数据库分别有39,475、48,751、46,769条Unigenes比对到Nr蛋白质数据库,分别有30,519、37,539、36,078条Unigenes被归类到61个GO功能类别中,分别有11,755、15,646、14,803条Unigenes被归类到25个蛋白质直系同源簇(COG)功能类别中,分别有21,532、27,098、25,767条Unigenes被归类到128个经典KEGG代谢途径。All-Unigenes总库中分别有51,407、37,640、17,735、29,197条Unigenes比对到Nr、GO、COG功能分类以及KEGG经典代谢通路当中。4、在人参根、茎、叶数据库中分别获得61条、48条、46条高表达基因(FPKM>1000)。同时,筛选出人参根特有高表达基因如植物生长储藏蛋白等;人参茎、叶特有高表达基因如筛管蛋白等;以及根、茎、叶非差异表达基因如泛素连接酶类蛋白等。5、在数据库中选取差异表达基因进行Q-PCR验证,实验结果与转录组数据基本一致,有效的证明了转录组数据库真实、可靠。结论:1、获得的人参根、茎、叶转录组数据库在GO功能注释、COG基因功能描述以及KEGG代谢途径注释中基本相似。2、人参根中高表达基因的功能主要与自身能量储藏代谢、环境压力胁迫相关;人参茎、叶高表达基因功能主要与叶绿素代谢相关。3、利用Illumina HiSeq2000测序平台构建人参根、茎、叶转录组数据库,可为人参药用部位与非药用部位基因结构与功能的进一步研究提供理论依据。