论文部分内容阅读
玉米(Zea mays L.)是重要的粮食、饲料和工业原料,其生产和可持续发展对我国的粮食安全至关重要。干旱是造成全球农作物减产的主要非生物因素之一,严重限制了玉米产量的稳定与增长。整合分子生物学、遗传学、生物信息学等多种手段,发掘具自主知识产权的玉米抗逆基因和关键调节因子,利用基因工程定向改造玉米在非生物胁迫下的耐受能力,可更加高效地培育抗逆玉米品种。Lnc RNA(long non-coding RNA,长链非编码核糖核酸)是一类长度大于200 nt且无蛋白质编码潜力的转录本,在植物逆境胁迫响应过程中扮演着重要的角色。本研究以玉米耐旱自交系AC7643与干旱敏感自交系AC7729/TZSRW及其构建的重组自交系(Recombinant Inbred Lines,RILs)中极端耐旱性自交系为研究材料,在正常供水和干旱胁迫条件下对苗期根系进行全转录组测序及小RNA测序,在全基因组范围鉴定并分析lnc RNA的表达特征以及对干旱胁迫的响应特点,结合组蛋白修饰、DNA甲基化、RNA甲基化修饰等多组学分析,探索lnc RNA基因表观遗传与干旱胁迫诱导lnc RNA表达关系,推测干旱诱导的lnc RNA的产生机制。此外,通过WGCNA构建基于lnc RNA的干旱胁迫应答共表达网络,筛选其中干旱应答关键模块及其调控基因Zm IMP3,并对其功能进行初步分析,主要研究结果如下:1、干旱胁迫应答的lnc RNA具有不同的序列特征。在正常供水和干旱处理下的16份不同干旱敏感程度的玉米自交系根系中共鉴定2031个lnc RNA,其中89.9%的lnc RNA都处于Intergenic(基因间区),4.6%的lnc RNA与编码基因具有反向重叠区域。82.6%的lnc RNA都是单外显子,响应干旱胁迫的单外显子lnc RNA比例、长度均显著高于不响应胁迫的lnc RNA对应值,该趋势在编码基因中却相反,即长度相对较短的编码基因响应干旱胁迫的比例更大,而基因序列较长的lnc RNA更趋向于响应干旱胁迫。子代特异表达的lnc RNA比例显著高于编码基因,且干旱胁迫条件下特异表达的lnc RNA比例也高于编码基因,即lnc RNA表达保守性显著低于编码基因。2、干旱胁迫应答的lnc RNA表达具有材料特异性。本研究共分别鉴定1452个(75.5%)lnc RNA与28004个(69.1%)编码基因响应干旱胁迫。与正常供水的对照相比,干旱胁迫下lnc RNA差异表达倍数(Fold change)变异系数比编码基因对应值更大。在干旱胁迫后lnc RNA和蛋白编码基因中下调表达比例都显著高于上调比例(P<2.2e-16,卡方检验),且lnc RNA对应比例皆显著高于编码基因(P<2.2e-16,卡方检验)。此外,在子代中特异响应干旱胁迫的lnc RNA比例显著高于编码基因,而亲代中特异响应胁迫比例低于编码基因。位于重组位点的子代特异表达基因中,lnc RNA的比例(17.4%)显著高于编码基因比例(7.9%,P=3.084e-07,卡方检验),即重组位点更容易转录产生lnc RNA。另一方面,两类基因在不同干旱耐受性自交系间特异响应胁迫数量并没有差异,但lnc RNA的特异响应胁迫数量显著高于编码基因。通过统计基因序列变异与玉米干旱胁迫下植株存活率显著关联的个数,衡量基因对干旱胁迫的响应及其可能的分子功能。lnc RNA基因中显著富集与干旱胁迫后植株存活率显著关联的SNP,暗示其在玉米干旱胁迫应答中具有功能。3、通过i Loc-m RNA_localtool预测转录本的亚细胞定位,发现lnc RNA与m RNA的亚细胞定位分布具有差异。Lnc RNA主要位于细胞质(41.1%)与细胞核(34.7%),而m RNA主要位于核糖体(38.1%)。比较不同亚细胞器分布的两类转录本,均在细胞核中分布的RNA最长,而在核糖体中转录本表达量最高(P<2.2e-16,HSD法多重检验)。对于不同水分条件特异表达的转录本,其分布与其总RNA分布一致,但细胞核中的lnc RNA响应干旱胁迫比例最高(23.28%),且其下调个数显著高于上调个数,而m RNA在细胞核的响应胁迫比例(16.5%)最少,表明定位于不同亚细胞器的转录本对干旱胁迫响应程度与应答方式具有差异。4、Lnc RNA host genes位点的表观修饰水平低于编码基因位。转录本的表达往往与基因上的表观修饰水平相关,为了分析lnc RNA表达时其对应DNA序列的表观修饰特征,本研究比较了lnc RNA与m RNA基因上下游1 kb及基因范围内的DNA甲基化和H3K9me3、H3K36me3、H3K9AC、H3K27AC、H3K4me3与H3K4me1等6种组蛋白修饰在分布及对干旱胁迫应答的差异发现,lnc RNA相较于编码基因表现出更低的组蛋白修饰水平,特别是在H3K9me3、H3K4me3、H3K9AC、H3K27AC等促进转录的组蛋白修饰上尤为显著。与编码基因相比,lnc RNA转录起始位点上表观修饰富集程度并不高,其中与基因剪切密切相关的H3K36me3与lnc RNA m6A修饰并未检测到显著富集的区域,这或许能部分解释lnc RNA剪切事件较少的原因。此外,在不同耐受性材料中特异表达的lnc RNA在其基因位点具有较高的H3K9AC修饰水平,且干旱敏感型自交系特异表达lnc RNA基因上富集水平更高。Lnc RNA与编码基因上H3K4me1、H3K27AC及RNA m6A修饰水平均在干旱胁迫后上调,而H3K4m3、H3K27AC、m6A下调。编码基因5’端H3K9AC修饰水平在胁迫下显著下调而lnc RNA在该位置无明显变化。在干旱处理后,编码基因3’端的H3K4me1水平高于5’端,而lnc RNA变化趋势相反。5、上游调控基因Zm IMP3的敲除材料表现出耐旱性弱于野生型。将在任一材料中差异表达的28011个编码基因、1452个lnc RNA及181个mi RNA通过WGCNA构建玉米根系干旱应答共表达网络,一共获得63个模块,其中最大的模块包含6570个基因,最小的模块包含37个基因。进一步将干旱胁迫后表型与各模块关联,获得23个与表型相关的模块,其中16个模块与干旱胁迫后存活率相关,大部分模块富集生长发育、根系生长、胁迫响应、糖代谢等GO terms。选取与干旱胁迫下玉米植株存活率显著相关的模块,综合衡量模块中基因与模块的连接度以及基因表达与耐旱相关表型的拟合程度,筛选到模块中关键lnc RNA XLOC_028441和XLOC_038711。此外,通过在自然群体中筛选表达模式与玉米耐旱相关关键模块所有基因表达相对一致的RNA结合蛋白发现,RNA结合蛋白Zm IMP3与MEgreen模块显著正相关,即可能调控该模块中大部分基因表达的关键上游基因。Zm IMP3在干旱胁迫下表达量显著上调。在玉米自交系CO1中敲除Zm IMP3,共得到四种不同类型编辑事件的株系。通过转录组测序后发现,XLOC_028441在敲除材料中不表达,此外,MEgreen模块中40个相关基因均显著下调。Zm IMP3敲除后转基因植株整体生长趋势弱于野生型,且对干旱胁迫更为敏感,干旱复水后敲除材料根系恢复程度显著弱于野生型。