论文部分内容阅读
分子特征是指转基因植物中外源DNA片段在受体基因组中的整合、表达以及遗传稳定性等方面的信息,主要内容有插入外源基因的拷贝数、插入位点的侧翼序列、插入序列的完整性、是否有载体骨架序列的插入等。分子特征是研发者筛选和鉴别转化体重要依据,也是转基因植物安全评价的主要内容。目前,插入外源基因的拷贝数可以通过Southern杂交、荧光定量PCR或数字PCR等方法进行解析,插入位点和侧翼序列可以通过基于PCR的染色体步移技术获得。这些技术适用于解析外源插入片段整合情况比较简单的转基因作物的分子特征,但对于同一位点插入多个拷贝等复杂整合情况、包含多个外源基因的复合性状转基因作物、以及应用基因编辑和合成生物学等技术研发的新型转基因作物的分子特征的解析往往不够精准。随着DNA测序技术的发展和大数据时代的到来,NGS(Next Generation Sequencing)技术以其高通量、灵敏度高、可操作性强、和可重复性强等特点,为精准解析转基因植物的分子特征提供了新的技术方案。本研究在对NGS测序技术的发展、NGS技术在转基因植物分子特征解析中的应用、以及国外转基因植物安全评价中对高通量测序数据的要求等背景调研的基础上,总结了NGS技术解析转基因作物分子特征的技术方法,对NGS测序和传统方法解析转基因作物分子特征的技术原理与结果进行了系统的比较,并将NGS不同测序平台的测序结果及数据处理方式进行了对比。主要研究内容与结果如下:1.建立了NGS技术解析转基因作物分子特征的技术方法。以转基因抗草甘膦水稻G2-7转化体及其亲本中花11为样本,利用Illumina NovaSeq 6000平台进行全基因组测序,共获得了129.72Gb的测序数据,通过与水稻参考基因组和转基因载体序列的比较,确定了G2-7转化事件的外源基因为单拷贝插入,无质粒骨架的插入,插入位点为水稻Oryza sativa Japonica Group 1号染色体,造成了水稻基因组16 bp的缺失和插入外源DNA参考序列两端共49 bp的缺失,并用序列拼接的方法找到了插入位置左右分别375 bp和353 bp的侧翼序列,证明了使用NGS技术和生物信息学方法相结合的方法,能够为评估转基因植物的安全性提供节省时间和成本的有效方法。2.对整合情况较为复杂的转化体的分子特征解析。用Illumina HiSeq 4000平台对转基因抗草甘膦水稻G2-6转化体及其亲本中花11进行全基因组测序,深度分别为20×、30×、40×、70×,共获得了149.35 Gb的测序数据,用PacBio Sequal平台对抗草甘膦水稻G2-6转化体及其亲本中花11进行全基因组测序,数据量为20 Gb。通过Illumina平台和PacBio平台测序结果结合的方法对G2-6转化体进行了分子特征解析,确定了G2-6转化事件的外源基因为单拷贝插入,无质粒骨架的插入,插入位点为水稻Oryza sativa Japonica Group 8号染色体,造成了水稻基因组31bp的缺失和插入外源DNA参考序列两端共69 bp的缺失,将Illumina和PacBio的测序数据结合分析,获得了传统方法无法获得的插入位点左右两端分别为278 bp和773 bp的侧翼序列,并发现了G2-6转化体3’端的一段482 bp的非预期插入序列,说明PacBio测序平台在解决复杂的外源DNA串联、重复等情况有独特的优势。3.对NGS测序技术在转基因安全评价中的应用过程中的一些技术方法进行了比较,包括不同的测序平台、不同的数据分析软件以及不同测序深度进行了对比,本研究中使用Illumina和PacBio测序结果进行分子特征解析能够得到拷贝数、插入位点、载体骨架插入方面一致的结论,对于复杂转化体的侧翼序列,可以用PacBio测序结合Sanger测序结果进行分析;本研究中对Illumina测序结果分析使用的两种比对分析软件和可视化软件均能得到一致的结论,在软件的选择上可以根据测序数据量及参考序列大小进行选择;在同批次建库测序的条件下,Illumina测序获得的数据量与测序深度成正比,在进行侧翼序列组装时,建议使用30×以上的测序数据,确保接合区获得的数据量充足。以上结果为NGS在转基因作物安全评价中的应用提供了参考。综上,本论文的研究结果表明,NGS技术在解析转基因作物的分子特征方面能够得到与传统方法相当的结果,并且在解析复杂整合体的分子特征时能够克服传统方法的不足,有着更高效、快速的优势。本文为NGS技术在我国转基因生物安全评价中的应用提供了理论支撑。