论文部分内容阅读
互补脱氧核糖核酸(Complementary DNA,cDNA)文库是一个物种所有表达蛋白序列的遗传模板。它是物种在各时空条件下转录组的集合,包含了基因在特定时期的不同转录本,是物种基因转录表达多样性的体现。文昌鱼是研究从无脊椎动物到脊椎动物演化的潜在优秀模式物种,建立其完整的cDNA文库将有助于在组织、细胞和分子水平深入地开展各项研究,从而促进文昌鱼的模式化发展。目前,虽然已有大量的文昌鱼基因组和转录组的数据,但尚缺乏一个较完整的文昌鱼cDNA文库。在本研究中,我们选取了佛罗里达文昌鱼为研究对象,结合新一代测序拼接技术,建立生物信息学工作流,整合来自于基因组、不同条件下转录组、EST库等的多元数据,构建佛罗里达文昌鱼cDNA整合文库,并给予功能注释。初步的研究结果显示,佛罗里达文昌鱼在8个不同发育阶段,共表达了95,762条不同的cDNA。聚类结果显示,这些cDNA至少有10%以上的个体序列差异。通过对序列的长度统计以及原始数据映射分析,该结果,无论从cDNA的数量以及序列完整度上,都远高于由基因组提取的mRNA集或以基因组为参考的单一转录组cDNA文库。 此外,以佛罗里达文昌鱼cDNA整合文库为参考模板,我们对文昌鱼胚胎发育不同时期的转录组进行重新拼接、注释和模式分析,初步发现了一系列与神经发育相关的特异表达基因,并构建出基因关系网络图。 综上所述,我们所建立的生物信息学cDNAs文库构建工作流是可靠、有效的。它将协助我们解决在没有参考基因组或基因组注释较差情况下的各种组学拼接和注释难题。我们相信,随着更多数据的整合,其所构建的cDNA整合文库将接近于完整。