论文部分内容阅读
森林的可持续发展关系到全球生态环境和全人类的生存。人工林作为全球森林资源的重要组成部分,在气候调节、水源涵养和水土保持等方面发挥着重要作用。但许多生物不稳定因素,如环境抵抗能力差、生物病虫害等,大大降低了人工林的生产力。松属树种作为人工林中种植最为广泛的树种之一,正遭受着病虫害的侵袭。松材线虫病是由松材线虫引起的松属树种毁灭性死亡的一种世界性森林病害。传统的线虫检测方法包括:形态学、免疫学、病理学、遗传学和生理生化学等方法,但往往受到植物线虫发育阶段和检测环境条件等因素的制约,很难达到快速、准确鉴定的目的。太赫兹(THz)光谱技术作为传统检测技术的有力补充,对探测物质结构存在的微小差异和变化非常灵敏,具有反映化合物结构的指纹特征。理论计算表明在THz频段存在大量的DNA分子主链间激发的本征共振(例如,螺旋式扭曲,氢键振动,碱基漂移振动等)。利用THz时域光谱技术进行DNA束缚态的基因识别,无需对DNA片段作荧光标记,实验相对简单、操作方便。本课题以松材线虫、拟松材线虫等七种生物DNA,以及它们的主要组成部分(碱基、碱基对、特征片段)为研究对象。借助傅里叶红外光谱仪、太赫兹时域光谱仪、拉曼光谱仪、X射线晶体衍射仪等设备,获得了它们在太赫兹和中红外波段的振动光谱。应用基于PBC-GEBF(周期性边界条件下能量分块方法)的量子力学方法以及分子动力学方法对它们的振动光谱进行解析,为快速鉴别松材线虫和拟松材线虫奠定了基础。本文的主要研究成果如下:(1)获得并详细解析了DNA/RNA碱基、碱基对和特征片段样品的太赫兹光谱,同时对碱基晶体的中红外和拉曼光谱进行了研究。利用太赫兹时域光谱仪和傅里叶红外光谱仪测试得到五种核酸碱基、碱基对共晶C:G、以及两种DNA特征片段(5’-d(AT)13-3’和5’-d(CG)13-3’,各含26对碱基)的太赫兹(THz)光谱。利用Gaussian09软件,结合密度泛函理论和PBC-GEBF方法,计算了五种核酸碱基晶体、含有取代基的三种碱基对共晶(9MA:1MT/1MC:9EG/1M5BU:9MA)以及DNA/RNA特征片段(5’-d(AT)2-3’,5’-d(CG)2-3’,5’-AUCG-3’)的振动光谱,研究发现,计算光谱和实验光谱一致吻合,说明密度泛函理论和PBC-GEBF方法可以很好地描述晶体分子间和分子内的弱相互作用。在太赫兹频段晶胞内分子的振动模式均来源于所有原子参与的集体振动。A:T和A:U碱基对中的两条氢键很容易断裂,在制备样品的过程中并没有真正地形成共晶,而C:G共晶结构中因为存在三条氢键,在样品干燥的过程中氢键没有断裂,形成了约几微米的共晶(微晶)。甲基和乙基作为取代基对分子光谱中吸收峰的强度和位置影响不大,但卤素原子溴作为取代基对光谱有一定的影响。但不管是何种取代基,都对振动模式影响很大,这是因为太赫兹波段的振动模式主要表现为所有原子或分子参与的集体振动,即使结构有细微变化,对振动模式的影响都很大。对于DNA/RNA特征片段,太赫兹波段的振动模式均主要源于DNA/RNA骨架的振动或转动,与其构成的二级结构无关。研究表明,基于晶体结构的中红外和拉曼计算光谱与实验光谱一致吻合。(2)测试并分析了松材线虫、拟松材线虫等七种生物DNA样品的太赫兹光谱。利用傅里叶红外光谱仪和太赫兹时域光谱仪测试得到了七种DNA样品的太赫兹光谱。研究发现,不管是在太赫兹波段还是在亚太赫兹波段,傅里叶红外光谱仪测得的不同生物DNA的光谱都极为相似,无法通过吸收峰的位置来进行分辨。而利用太赫兹时域光谱仪测得的不同生物DNA的光谱在吸收峰位置上有一定的区别,但是由于吸收峰太多,较难分辨。(3)测试并分析了松材线虫/拟松材线虫rDNA ITS1区特征片段及短序列的太赫兹光谱。利用数据挖掘技术获取了松材线虫/拟松材线虫rDNA ITS1区有差异的特征片段(约280对碱基)。利用限制性核酸内切酶和蒙特卡洛(Monte Carlo)方法获取代表松材线虫/拟松材线虫rDNA ITS1区特征片段的短序列。通过基因合成技术制备样品,利用傅里叶红外光谱仪测试得到了酶切短序列太赫兹光谱。同时利用AMBER软件结合分子动力学理论,模拟了所有DNA短序列的振动光谱。研究发现,酶切短序列的计算光谱与实验光谱一致吻合,虽然不同的DNA短序列在实验和计算光谱上没有表现出明显的差异,但是振动模式却与内部碱基排序有着很大关联,故可通过振动模式差异区分松材线虫和拟松材线虫DNA。研究还发现,在一定程度上,二阶马尔科夫(Markov)链和Monte Carlo方法预测的短序列可以代表完整序列作为计算的初始结构,且预测短序列越长,计算结果越接近实验值。