论文部分内容阅读
棉花是世界上重要的经济作物之一,其棉纤维不仅是纺织工业的原材料,而且可以作为纤维能源应用于工业发展,研究纤维发育机理对于棉纤维改良具有重要意义。本研究收集了278份棉花品系材料组成自然群体,利用简化基因组(SLAF-seq)技术开发单核苷酸多态性(SNP)标记,基于SNP标记进行全基因组关联分析(GWAS)和全基因组单体域(LD Block)及单体型(Haplotype)分析。同时结合生物信息方法学和实时荧光定量实验,分析棉花四个物种全基因组纤维素合成酶基因的进化情况及其在纤维发育过程中的表达模式,这些为进一步改良棉花纤维育种工作和解析纤维发育分子机制奠定了一定的基础。利用简化基因组测序(SLAF-seq)技术共开发到SNP标记3,464,561个,在完整度0.85,最小等位基因频率0.05水平上过滤得到SNP标记54,541个。在此基础上,分别进行了群体的群体结构、主成分分析及系统进化树,结果表明该群体可以分为三个亚群,这三个亚群在纤维强度上差异达到极显著(p<0.01)。通过全基因组关联分析,共关联(p<9.46e-8)到分别与纤维强度(FS)、纤维长度(FL)、纤维马克隆值(FM)和衣分(LP)相关的优异位点各670、678、1393和476个。基于连锁不平衡原理,分析全基因组范围的单体域及其内部的单体型频率,得到分别与FS、FL、FM和LP相关的单体域各15、14、25和31个。并进一步分析了其中一个单体域(Block4)内的三个单体型,发现Hap1与LP相关,而Hap3与FS和FL相关。这些与目标性状相关优异位点有助于下一步候选基因的筛选,而单体域及单体型的结果可能为分子育种工作提供一定的参考。GWAS候选基因中有两个在纤维发育28DPA时期超高表达的基因(GhA08G0421和GhA05G3965)注释到纤维素合成酶基因,维素合成酶是影响细胞壁合成过程中控制纤维素合成的一种非常重要的蛋白质。通过生物信息学方法,系统分析了陆地棉、海岛棉、亚洲棉和雷蒙德氏棉四个棉种的纤维素合成酶在全基因组上的进化和在纤维发育时期的表达模式。在整个棉花纤维合成酶进化过程中,直系同源基因和旁系同源基因受纯化选择(dN:dS<1),而在各个亚家族枝系之间,CSLJ亚家族受到一定的正向选择压力,枝-位点模型分析发现CSLJ和CSLG枝系在纤维素合成酶蛋白的CSR区分别含有1个和2个正向选择位点,这可能会影响功能分化的方向。利用转录组数据分析和qRT-PCR实验验证,发现在四个棉种纤维发育过程中,均至少有一半以上的基因表达,且具有一定的表达差异性,同一亚家族的不同成员表达量差异很大,如GhCesA802在次生壁加厚期几乎不表达,而GhCesA801和GhCesA803的表达量(FPKM值)则超过1000。启动子分析也表明,差异表达的同源基因间,其上游启动子区顺式作用元件也有较大变化。这些结果可能为进一步分析棉花纤维素合成酶基因的功能和表达模式具有一定的参考价值。