论文部分内容阅读
牡丹(Paeonia suffruticosa)为芍药科(Paeoniaceae)芍药属(Paeonia)牡丹组(sect. Moutan DC.)落叶小灌木,花期短且集中,同时我国牡丹栽培品种以中花品种占优势,早晚花品种比例很小,严重限制了牡丹观赏应用和国际化市场的发展。因此,深入研究牡丹开花分子机理对于开花机制解析及其花期调控具有重要意义。本研究以早花品种‘凤丹’为母本,晚花品种‘新日月锦’为父本,构建分离群体,选取父本、母本及其杂交后代中开花特早、特晚个体的盛花期花瓣为试材,提取RNA,构建早花混池和晚花混池,基于Illumina HiSeqTM2500平台,进行BSR-Seq分析,主要研究结果如下: (1)利用 BSR-Seq技术对4个样本进行测序,父本得到37,069,313条reads,母本得到33,883,337条reads,而早、晚花两个混池平均得到76,779,815条reads,通过严格的筛选,共得到56.51 Gb Clean Data,且各样品的Q30碱基百分比均大于85%,GC分布正常,含量平均为44.70%。这表明BSR-Seq建库成功。序列经过组装共得到173,960条Transcript和78,645条Unigene。 (2)通过对测序数据的组装,共得到3,457,732条 Contigs,173,960条Transcript和78,645条Unigene。Contigs的平均长度为59.211 bp,Transcripts的平均长度为1106.74 bp,Unigene的平均长度为732.27 bp。且其中Transcript和Unigene的N50分别为1781 bp和1282 bp,这表明基因组拼接结果较好。 (3)使用 BLAST软件将Unigene序列与 NR、Swiss-Prot、GO、COG、KOG、KEGG数据库进行比对,预测 Unigene的氨基酸序列,然后使用HMMER软件与Pfam数据库比对,获得Unigene的注释信息。最终在NR数据库中注释到27,774个Unigene,在GO数据库中注释到15,324个,在KOG中获得15,919个,在 Pfam中得到18,130个,在Swiss-Prot中获得17,324个,在COG中注释到7,978个,在KEGG数据库中得到9,572个。共获得58,084个有注释的Unigene。 (4)通过基因差异表达的分析,得到父母本中差异表达基因最多,共为4789个,其中2309个上调基因,2480个下调基因。子代中差异基因为3783个,包括1879个上调基因,1094个下调基因。早花混池与亲本两混池中差异表达基因总数均在4000以上,而晚花混池与亲本两混池中差异表达基因总数均在3000以上。 (5)通过对差异表达基因进行GO功能显著性富集分析,得出父母本间的差异表达Unigene有3132条归入生物学过程,1425条归入细胞组分,1686条归入分子功能;早晚花间的差异表达Unigene有4133条归入生物学过程,1748条归入细胞组分,2299条归入分子功能。 (6)通过对差异表达基因进行KEGG注释,得到父母本间的差异基因在淀粉和蔗糖代谢通路中富集47个,碳代谢33个,植物激素信号转导31个,苯丙素生物合成31个;在早晚花之间的差异基因在植物激素信号转导上有50个,在淀粉和蔗糖代谢上49个,碳代谢44个,苯丙素生物合成35个,氨基酸生物合成34个。 (7)通过对测序数据的开发,共得到了219,291个 SNP位点,父本190,392个,母本185,929个,早花池207,438个,晚花池206,410个。通过过滤,与亲本的差异位点有9579个,混池间的差异位点有161,888个。 (8)通过BSR关联分析,最终筛选出9个显著富集关联位点的Unigene序列,它们是 c42942.graph_c0、 c46352.graph_c0、 c58332.graph_c0、c58361.graph_c0、 c54876.graph_c0、 c57417.graph_c0、 c55633.graph_c0、c58526.graph_c0和c53143.graph_c0。 (9)通过qRT-PCR技术,分析这9个与开花早晚紧密相关的Unigene在不同样品中的表达,结果显示大部分Unigene表达趋势一致,表明这些基因与牡丹开花时间紧密相关,且证明该转录组数据是准确和有效的。