论文部分内容阅读
米曲霉,是我国传统酿造行业的优良菌种,具有极强的蛋白表达和分泌能力,在食品、饮料、化妆品、医药等领域具有重要的应用。随着米曲霉遗传转化系统的逐步建立,米曲霉成为极具潜力的异源重组蛋白表达系统。然而,米曲霉转录组学的研究却进展缓慢,依靠EST技术和基因芯片技术的转录组学研究受到自身检测范围和灵敏度的局限,很难揭示米曲霉转录组的功能复杂性。而且,米曲霉在固体、液体培养条件下生长表型出现显著差异,并导致蛋白表达和分泌的差异,其中的原因仍不清楚;异源蛋白在米曲霉中的表达,与同源蛋白相比,表达水平很低,其中的原因有待分析。针对以上米曲霉的基础生物学问题,作者采用最新发展起来的RNA-Seq技术对米曲霉的转录组进行解析,并在转录组水平上研究上述问题。本研究对米曲霉在不同培养条件下的RNA样品进行RNA-Seq测序,测序得到的序列片段(reads)对米曲霉基因组的覆盖高达145倍,有超过90%的reads是高质量的在基因组上特异匹配的reads。根据RNA-Seq reads在米曲霉基因组及基因上的匹配,绘制了米曲霉全基因组水平的转录图谱。通过代表基因转录水平的标准化数据RPKM判定米曲霉基因组的12074个蛋白编码基因中共有11263个发生转录表达,使得米曲霉基因的注释率达到93.28%。基于RNA-Seq数据,在米曲霉基因组范围内分析基因转录体的结构:确定了4198个基因的5’非翻译区(5’UTR)和4357个基因的3’非翻译区(3’UTR),并分析了UTR长度分布及其与基因功能的关系;确定了1345个米曲霉基因的上游开放阅读框(uORF)和272个基因的上游起始密码子(uATG),其中具有uORF的基因占米曲霉蛋白编码基因总数的11.14%,是酵母的两倍;发现了1166个新转录本和800个新外显子(存在于513个已知基因中),Augustus软件预测认为共有700个新转录本可能编码新的蛋白。基于RNA-Seq数据,在米曲霉基因组范围内分析基因转录体的可变剪接(alternative splicing,AS)。结果表明,总共在1032个米曲霉基因中确定了1375个可变剪接事件,具有可变剪接的基因占米曲霉基因总数的8.55%,米曲霉是目前真菌中检测到可变剪接数量最多的物种。其中,内含子保留(retained intron,RI)是米曲霉中占比例最大的可变剪接形式,达到总数的91.56%,而RI在哺乳动物中则是十分稀少的AS形式,这是米曲霉区别于高等生物的可变剪接的一个特点。通过分析米曲霉中发生RI的基因数目和发生外显子剪接(cassette exon,CE)的基因数目的比例以及RI和CE的长度关系,推测ID(intron definition)机制是米曲霉基因可变剪接中识别剪接位点的主要机制。基于不同培养条件下的米曲霉RNA-Seq数据,比较了米曲霉在两种基本培养方式(固体培养(solid-state culture,SC)和液体培养(liquid culture,LC))下基因的差异表达,分析得到4628个差异表达基因(p-value<0.001),固体培养条件下转录上调的有2355个,液体培养条件下转录上调的有2273个。GO功能富集分析和KEGG代谢途径分析表明在固体培养条件下米曲霉的蛋白质翻译及修饰、能量代谢等比在液体培养条件下更加强大。通过比较米曲霉在内质网压力胁迫下(二硫苏糖醇DTT处理)的差异表达基因,分析了内质网压力胁迫下米曲霉的蛋白分泌模式;通过对内质网压力胁迫下米曲霉蛋白分泌调控的分析,推断米曲霉在固体培养条件下比在液体培养条件下,具有更强的蛋白分泌调节能力。本研究通过RNA-Seq技术深入解析了米曲霉的转录组,对米曲霉的基因结构、新转录本、代谢途径、可变剪接、蛋白表达及分泌等方面进行了研究,为米曲霉的基础生物学研究、基因工程和工业应用提供了参考数据。