论文部分内容阅读
本研究将海带配子体eDNA抑制消减文库所产生的627克隆进行测序,按照序列匹配部分大于100 bp并达到95%以上相似性的标准,使用DNAMAN软件去除低质量的EST,将剩下的618条EST聚类成187条TUGs。其中93条为Contigs,它们由524条EST产生,剩下的94条为Singletons,冗余率为69.74%。65条TUGs个序列与已报道的基因有较高的同源性,122条在GenBank上无显著匹配。在已知基因中,大部分与能量代谢、物质转换和蛋白质生物合成相关,其中仅光捕获蛋白基因就有73条,还有一些与生长发育、信号转导、抗逆和防御以及物质运输相关。另外,本研究还对密码子使用进行分析,结果表明:58个Contigs的总G+C含量平均值是0.5146,24个TUGs(1751密码子)中,密码子第三位碱基的G和C含量分别为26.3%和33.5%,TGA、TAG和TAA等3种终止密码子的使用率差别较大,分别为70.8%、12.5%和16.7%。此外,非编码区G和C含量比ORF区略高。本研究为开展海带雌、雄配子体差异表达基因克隆、分析和功能基因组学等研究提供了条件和信息。
根据糖海带(L.saccharina)lhcf5开放阅读框(ORF)及海带配子体消减库中E04克隆的序列设计引物,利用反转录PCR方法获得了海带配子体lhcf5基因的cDNA序列(GenBank登录号:EU751620)。该序列的ORF与糖海带lhcf5编码序列的相似性高达99%,而3’非翻译区(UTR)序列的相似性只有96%。经推测,海带配子体lhcf5基因序列的ORF编码一个含218个氨基酸的前体蛋白LHCF5,其氨基端的40个氨基酸组成信号肽,跨膜酶切后变为含178个氨基酸的成熟蛋白,它的分子量为19.3 kD,等电点为4.86。预测的成熟蛋白LHCF5高级结构存在4个保守性的p折叠和3个跨类囊体膜的α-螺旋区。
根据海带配子体LHCF5成熟蛋白以及GenBank中9个同源蛋白质的氨基酸序列所构建Neighbor-joining分子进化树,显示藻类在光捕获蛋白氨基酸序列水平上存在着红藻、杂色藻类、绿藻等三个方向的演化途径,其中绿藻与高等植物的亲缘关系更近。在本研究中,还根据lhcf5的cDNA序列设计引物对海带配子体基因组DNA运用锚定PCR法扩增,将该结果与此引物所进行的基因组DNA PCR扩增结果拼接,获得了lhcf5基因的DNA序列。通过对lhcf5基因与其cDNA序列的比较,发现在雌、雄配子体LHCF5的信号肽处分别存在着一个1137bp、1135bp长的内含子,为该基因的结构及其功能的进一步研究奠定了基础。