茶树全器官转录图谱和基于WGS的全基因组特征的初步研究

来源 :安徽农业大学 | 被引量 : 1次 | 上传用户:fionazj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
茶树(Camellia sinensis)是世界三大饮料作物之一,起源于中国。茶具重要的经济价值和世界影响力,而且富含儿茶素、咖啡碱和茶氨酸等特征性次生代谢物,这不仅决定了茶的滋味和品质,而且是茶具有重要保健作用的物质基础。由于茶树自交不亲和,基因组高度杂合且较大,茶树基因组研究基础比较薄弱,缺少全基因组序列图谱;茶树在全基因组广度的转录图谱也不够完善,且遗传转化体系尚未完全建立,这些因素极大地限制了茶树生物学的研究,目前不仅克隆和验证的功能基因相当有限,茶树特征性次生代谢物产生和调控的分子机制也尚未完全解析。本研究旨在采用近年发展起来的下一代高通量测序技术在国内外首次构建茶树基因组框架图和全器官转录组图谱,并进行茶树和野生近缘种基因组广度的SNP发掘。茶树基因组和转录组数据库的建立不仅使得解析茶树基因组特征和进化成为可能,还将对茶树生物学研究(尤其是次生代谢形成和调控机制的研究)提供前提条件和重要平台。本论文的主要研究结果如下:1.茶树全器官转录组深度测序揭示茶树特征性次生代谢途径相关基因本研究利用RNA-Seq技术在国内外首次建立茶树全器官转录组。通过Illumina测序平台,对栽培茶树国家级良种龙井43的全组织器官混合样本进行深度测序,测序数据量达到2.59Gb,经从头(de novo)拼接后得到127,094条Unigene,平均长度355bp,N50长度为506bp。利用GenBank中的茶树EST不仅评估了茶树转录组数据质量的可靠性,还评估了数据量的高覆盖度。利用七个公共数据库,55,088条Unigene获得基因注释、GO(Gene Ontology)功能注释或KEGG代谢途径注释。发现了很多参与茶树初级代谢以及类黄酮、茶氨酸和咖啡碱次级代谢途径涉及的主要基因,并发现一些参与次级代谢的新的候补基因。对茶氨酸和类黄酮合成途径上相关的13种基因进行实时定量PCR分析这些基因在茶树不同组织中的表达模式。此外,基于本转录组Unigene搜索出12,242个SSR,包括单核苷酸重复到六核苷酸重复的各种类型,以二核苷酸重复类型为最多,占所有SSR的63.78%。此外,还对茶树转录组SSR的多态性和可用性进行了分析评价。2.茶树和4个野生近缘种(变种)的基因组SNP发掘及高分辨的物种鉴定和遗传关系研究本研究利用酶切位点相关DNA测序(RAD-Seq)技术对18株栽培茶树和野生古茶树(野生近缘种茶树个体)进行了高通量的简化基因组测序,每个样本获得的有效数据量平均达到2.94±0.67 Gb。对测序标签聚类和核苷酸位点的基因分型分析后获得15,444个高置信度的二等位SNP,并以此对18个供试样本进行系统发生关系分析、主成分分析和群体遗传结构分析,结果比较一致,表明基因组SNP能对供试样本中茶种和4个野生近缘种(变种)进行高分辨的物种鉴定,并了解其相互的亲缘关系。本研究首次在基因组水平上提供分子证据,推测大理茶邦崴变种很可能来自阿萨姆种和大理茶种的种间杂交。除了大理茶邦崴变种,供试栽培型茶树基因组杂合度普遍高于野生古茶树。此外,在获得的15,444个SNP位点中鉴定了1,521个基因区SNP,其相关的基因中1,058条被注释为拟南芥同源蛋白,24条涉及次生代谢过程。3.茶树基因组框架图绘制及基因组特征和进化的初步分析本研究在绘制茶树全基因组框架图前,先对栽培茶树品种安徽1号(AH1)、铁观音(TGY)和舒茶早(SCZ)和1株大理茶野生茶树(DXS)进行基因组调查测序。AH1、TGY、SCZ和DXS获得的有效调查测序数据分别为105.3、110.8、205.1和159.8Gb;采用17-mer估算4者基因组大小约在3-3.3Gb;4者的基因组杂合率约在1.5-2.2%,其大小排序为AH1>TGY>SCZ>DXS;4者的基因组GC含量分别约为38.50-39.92%;4株茶树基因组初步组装的contig N50长度均<700bp,scaffold N50长度均<3kb。在AH1和TGY初步组装序列中分别预测得到563,680和545,520个基因组SSR(gSSR)位点,并批量设计了262,807和257,564对引物。选择杂合度相对较低的栽培茶树SCZ为研究材料,结合全基因组鸟枪法策略和高深度测序和针对复杂基因组组装策略进行茶树全基因组测序研究。构建170~800bp短插入片段文库和2~20kb长插入片段文库,进行Illumina双末端测序,获得有效数据1,393 Gb。同时,对SCZ的8个组织器官进行转录组测序,获得有效数据量94.3Gb。对茶树全基因组测序数据进行de novo组装,产生contig的N50长度为33.4kb,contig总长度为2.45Gb;最终组装了92,207条scaffold,N50长度为347.1kb,总长度为2.98Gb。采用Genbank中登录的茶树EST评估组装的基因区覆盖度可达到约89.25%。随机的挑选3条茶树BAC序列(单独采用Sanger测序)和基因组组装的一致性较高,覆盖率分别为97.7%、100%和94.8%。利用RAD-Seq产生SCZ标签序列评估组装的基因组限制性酶切位点区域,覆盖率达到96.79%。茶树基因组重复序列约占基因组的56.06%,大部分为TE(占基因组52.69%),主要类型为LTR。预测茶树蛋白编码基因48,682条,平均基因长度为4,054bp,每个基因平均3.3个外显子,其中39,680条基因获得注释。此外,预测了652条tRNA、3,450条rRNA、723条miRNA和474条snRNA。基因家族分析表明33,922条茶树基因聚类到17,701个基因家族中,茶树特有的基因家族达到3,415个,茶树、猕猴桃、无油樟和桉树共有基因家族7,171个。茶树基因组进化分析表明表明茶树属于菊类分支,并且与猕猴桃科的亲缘关系最近,并估算两者的分化大约在近期的67.5百万年前发生。基于茶树基因组、转录组和BAC文库,鉴定和克隆了儿茶素合成关键基因LAR的基因组DNA序列,并分析了其基因结构。
其他文献
群体性抗议事件是指一定社会群体,为表达对政府、政治人物或某些大型组织(如企业)的政策、规定或行为的反对意见,在特定时间地点预谋性或自发性聚集,并以游行、静坐、罢工、
湖北省素有“千湖之省”美誉,渔业在农村经济发展中占有特殊的地位。湖北渔业的稳定发展不仅关系我国粮食安全,还关系广大渔民持续增收和生活水平的提高。但是渔业稳定发展还
冻土区是全球重要的有机碳碳库,冻土衰退导致冻土区土壤层中有机碳加速释放,查明冻土区有机碳归宿是全球碳循环研究的重要组成部分。高寒山区通常分布有大面积的多年冻土和季
文章介绍了山东省田庄煤矿选煤厂工艺系统设计、设备选型、系统优化措施、实际运行效果。
<正>内服方四则1.黄瓜皮500g,水煎服,代茶饮。2.鲜马齿苋30g,水煎服,每次50mL,分3次服。3.茯苓皮4g,川萆薢4g,土茯苓4g,白术2g,枳壳2g,地肤子2g,春砂仁2g。水煎服,每天1次,连
随着城市化的快速推进,发展过程中的各种问题不断凸显,其中,自然气候条件和人居环境恶化、高温热浪灾害频发等影响着全球范围的人类活动,现已经成为世界关注的热点问题。增加
中华茶文化源远流长,包含的内容博大精深,不但有物质文化层面的体现,还蕴藏在深厚的精神文明层面之中。在我国各个历史时期,茶的价值已超出饮食消耗品的单纯范畴,而是成为一
作为现今全球第一大商品期货市场的中国期货市场,历经20多年的发展,规范化程度不断提高,实现了平稳较快的发展,服务于国民经济的功能得到有效发挥。本文以期货公司业务需要不
植物中存在各种各样的修饰化反应,能够产生大量结构多样性的代谢物,这些反应通常能够改变这些代谢物前体的生物学功能。糖基转移酶介导的糖基化反应是引起次生代谢物多样性的
第一部分 非典型脑膜瘤患者肿瘤全切除术后行辅助放疗有效性的meta分析目的脑膜瘤是颅内最常见的肿瘤之一,Ⅱ级(非典型)脑膜瘤相比于Ⅰ级(良性)脑膜瘤,虽然更加少见,但有着更