论文部分内容阅读
水稻(Oryza sativa)不仅是世界上最重要的粮食作物之一,也是单子叶模式植物。水稻品种japonica Nipponbare和indica93-11为两个水稻亚种代表,广泛的种植于我国的南北区域,对环境与气候形成一定的适应性,在我国形成北粳南籼的生产格局。它们各自具有独自的生理特性和生长周期。转录组为特定生理条件下,细胞中全部转录产物的集合。通过对水稻发育过程转录组的研究,可以全面地了解基因表达调控在水稻发育过程中的调节作用以及对环境适应性。多聚腺苷化是基因在转录形成成熟的转录本之前的加工过程之一,即在转录本的3末端适当位点进行切割并加上50-250个腺苷酸残基,即poly(A)尾巴,通常也是产生一个成熟的转录本的最后一步。Poly(A)在基因的转录后调控过程中具有重要的生物学作用,比如决定转录子细胞核外运、参与蛋白质翻译起始复合物的形成、以及防止mRNA降解。水稻发育过程的转录组一直都是国内外学者研究的热点,但是利用高通量测序技术全基因组范围内对水稻发育过程中相关基因的3末端的信息研究的非常少。 本论文利用PAT-seq(Poly(A)tag sequence)高通量测序技术研究了水稻两个模式品系日本晴和93-11发育过程中不同时期不同组织中基因的选择性多聚腺苷化(Alternative polyadenylation,或APA)动态变化以及多聚腺苷化信号使用情况,同时利用统计学方法对日本晴数量性状基因(Quantitative trait loci,或QTL)的表达和APA的关系进行阐述,最后对93-11和日本晴形成南北适应性的分子机制进行探讨。通过全面而系统的了解两个水稻亚种发育过程中选择性多聚腺苷化动态变化以及对基因表达调控的影响,并深入探索APA在水稻发育过程中的生物学作用,为理解水稻发育过程中基因表达转录后调控提供新的认识,同时为育种工作提供参考。 主要结果如下: (1)利用PAT-seq测序技术对水稻日本晴发育过程中不同时期不同组织共14个样本的转录本进行3末端测序,共得到136,955,352个PAT,聚成68,220个PAC(Poly(A) site cluster),分布在28,032个基因。其中,有13,419个基因(47.9%)有2个或者2个以上的PAC,说明在水稻日本晴发育过程中广泛发生APA现象。在日本晴水稻花粉中发现最多组织特异性的PAC,其中有大约一半来源于表达基因的内含子区域。进一步分析发现,这些组织特异性的PAC富集在能量代谢、重要氨基酸代谢以及防御等通路之中。主成分分析(Principal component analysis,或PCA)发现日本晴花粉中具有明显不同的PAC表达模式,并且发现花粉表达的基因内含子区域的PAC单核苷酸轮廓和PAS(Poly(A) signal)与其他组织明显不同,进一步研究发现日本晴花粉的多聚腺苷化因子的表达水平与其他组织(比如20天的叶)也不同。这暗示水稻花粉的多个生物学事件与其他组织的不同可能与花粉的多聚腺苷化因子的表达水平发生变化有关。在水稻日本晴发育过程中发现许多APA位点变换基因,日本晴发育的早期阶段基因倾向于使用远端的PAC,后期倾向使用近端的PAC,同时发现APA变换现象改变了基因的表达水平。我们还发现差异表达的PAC和差异表达的基因是两个独立的生物学事件,两类基因富集的生物学过程也基本不同。通过统计学方法发现,QTL倾向于使用APA基因。QTL可以在不增加基因数量的前提下通过使用APA基因从而达到对QTL的微调。同时发现,与QTL关联的高表达基因的PAC主要分布在植株高度、抽穗日数、穗数、千粒重、分蘖数、根干重、籽粒产量、穗长和穗数等,暗示APA在调控水稻农艺性状方面的潜能。通过比较两个水稻亚种的PAT-seq数据,发现冷胁迫关键应答因子OsDREB1F在日本晴中发生了APA现象,而在93-11中没有发生APA现象,可能与日本晴耐受相对低温环境而适合北方种植有关。 (2)利用同日本晴相同的方法,对籼稻品系93-11的发育过程中不同时期不同组织共14个样本的转录本进行3末端测序,共得到137,398,368个PAT,聚成63,502个PAC,分布在24,786个基因中。其中,有10,724(42%)个基因有2个或者2个以上的PAC,说明在93-11发育过程中也广泛发生APA现象。在93-11花粉中也发现最多组织特异性的PAC,其中有大约一半来源于表达基因的内含子区域。这些组织特异性的PAC富集在一些杂环化合物分解代谢相关的生物学过程,暗示组织特异性的PAC参与了花粉中的一些防御性物质的生成。聚类分析发现93-11花粉中也具有明显不同的PAC表达模式,但是花粉内含子区域的PAC单核苷酸轮廓和PAS与其他组织相似,这一点不同于日本晴。在93-11发育过程中也发现许多APA位点变换基因,早期阶段基因也倾向于使用远端的PAC,后期阶段也倾向使用近端的PAC,也发现APA变换现象改变了基因的表达水平。研究发现,差异表达的PAC和差异表达的基因是两个独立的生物学事件,两类基因富集的生物学过程也基本不同。