论文部分内容阅读
山茶属是山茶科中包含物种数最多,也最具经济价值的一个属。该属植物包含许多代表性物种,例如茶树、茶花和普通油茶等,它们在茶叶和油脂生产及观赏花卉上有着极其重要的应用。然而,该属植物频繁的杂交与多倍化、加上缺乏用于进化分析的合适DNA片段,致使其系统发育关系认识不清,一定程度上阻碍了山茶属植物的高效开发与利用。为此,本项目试图在广泛收集山茶属植物材料的基础上,通过比较转录组和代谢组分析,结合业已构建的茶树基因组,系统厘清山茶属植物系统的发育关系;辅以该属植物特征性次生代谢物含量的测定,揭示与茶叶品质形成密切相关的特征性次生代谢物在山茶属植物中的分布样式和遗传规律,为高效发掘利用我国珍贵而丰富的山茶属植物种质资源、促进栽培茶树的遗传育种提供理论依据。主要研究结果如下:(1)利用Illumina novaseq 6000测序平台对山茶属经典分类系统中的16组共121种及其2种近缘植物叶片进行转录组测序,获得约928Gb高质量的转录组测序数据;对数据进行转录本组装获得16,778,018条山茶属植物转录本,平均N50长度为1084bp,组装完整度约为94.44%;转录本注释发现,7,240,353条转录本在已知蛋白数据库中均能找到同源基因,占组装转录本的55.13%;筛选获得224,258条转录本编码转录因子,其中MYB和MYB-related是山茶属植物中含量最为丰富的转录因子家族;鉴定得到到5,568,311个EST-SSR,其中786个在山茶属物种间表现出多态性,为山茶属植物的科学保护和遗传改良提供分子标记。(2)通过开展比较基因组学和转录组学分析发现,在116个山茶属植物及其近缘植物中共鉴定得到89,394个直系/旁系同源基因家族,其中9,623个为山茶属植物特有,5,793个家族为山茶属植物所共有;相比物种特有基因,山茶属植物共有基因表现出更高的序列和功能保守性;对茶(C.sinensis),糙果茶(C.furfuracea),滇山茶(C.reticulata),油茶(C.oleifera),尖连蕊茶(C.cuspidata),瘤果茶(C.tuberculata),凹脉金花茶(C.impressinervis)7种代表性山茶属植物旁系同源基因家族分析发现,山茶属植物的共同祖先在2800万年前发生过全基因组重复(WGD)事件,约32.32%的山茶属植物转录本依然保留WGD印记,它们与山茶属植物脂质代谢、色素代谢和茶叶品质形成相关;整合获得的山茶属植物转录本信息,构建了山茶属植物转录组数据库,该数据库集成了多种生物信息学工具(如功能富集分析、相关性分析、引物设计、序列比对等),有助于研究者快速检索及深度挖掘数据库中丰富的山茶属植物转录组数据并实现可视化。(3)在构建山茶属植物泛转录组的基础上,筛选得到405个高质量的低拷贝直系同源核基因;以四川大头茶为外类群,分别构建了山茶属植物极大似然树和贝叶斯树,发现两种策略构建的山茶属系统发育关系基本一致,大多数进化分支的支持率为100%,且得到其36个叶片形态特征数据的高度支持;研究发现,山茶属可划分为7个系统分支,其属下各组的系统发育关系支持茶组与秃茶组、油茶组与短柱茶组、瘤果茶组与半宿萼茶组、毛蕊茶组与连蕊茶组的合并处理;发现茶组为单系,红山茶组分支与油茶组分支亲缘关系较近,金花茶组为山茶属的基部类群;支持最新中国植物志对广东秃茶、丹寨秃茶和重庆山茶等物种的修订;基于叶绿体基因组构建的31种山茶属代表植物系统发育关系分为五个主要分支,其中茶组、红山茶组、金花茶组、油茶组均为多系,与核基因的结果冲突明显;进一步对山茶属植物分化事件进行估算发现,山茶属与大头茶属约在1430万年前发生分化,茶组可能起源于667万年前,茶树原变种与阿萨姆变种的分化时间约为149-216万年前。(4)对山茶属16组共计82种植物的儿茶素类化合物、茶氨酸和咖啡碱含量进行测定发现,山茶属植物特征性次生代谢物含量丰富、类型多样;相比非茶组植物,茶组植物倾向于积累高含量的儿茶素类化合物、咖啡碱和茶氨酸等与茶叶品质形成密切相关的特征性次生代谢物;EGCG和EGC分别是茶组和非茶组植物的优势儿茶素类化合物,且随着茶组植物的分化,EGC的含量逐渐降低,而EGCG含量逐渐升高;研究还发现,山茶属植物特征性次生代谢物含量的积累高度关联,其中儿茶素类化合物与咖啡碱的含量的相关性为0.91(p-value=1.15E-33),与茶氨酸的相关性为0.71(p-value=5.43E-14);茶组与秃茶组、瘤果茶组与半宿萼茶组具有相似的代谢物分布模式,与其系统发育关系高度吻合,进一步为它们的分类学合并处理提供植物化学证据。(5)重点以儿茶素类化合物代谢通路基因为研究对象,比较不同栽培茶树品种及其野生近缘茶组植物基因表达与代谢物含量的相关发现,类黄酮3’,5’-羟化酶(F3’5’H)、黄酮醇合成酶(FLS)、花青素还原酶(ANR)、丝氨酸羧肽酶类蛋白(SCPL1A)基因的表达模式与茶组植物中儿茶素类化合物的积累模式显著相关;初步挑选并克隆了F3’5’H基因的编码区和启动子序列发现,F3’5’H基因的编码区在茶组植物中高度保守,但其启动子区域在儿茶素含量高的茶组植物中存在包含两个MYB转录因子结合位点的180 bp插入突变;顺式调控元件预测表明该180 bp的插入突变可能增强了上游MYB转录因子对F3’5’H基因的激活活性,从而促进儿茶素类化合物在茶组物种中高度积累,进而造成儿茶素类化合物在茶组中的多样分布。综上所述,本研究通过对山茶属植物进行泛转录组和代谢组研究,系统厘清山茶属植物系统发育关系,全面揭示茶叶品质相关的特征性次生代谢物在山茶属植物中的分布样式和遗传规律,无疑有助于加快高效发掘利用我国珍贵而丰富的茶种资源、促进我国茶树、油茶和茶花种植产业和栽培育种的长足发展。