论文部分内容阅读
化合物的定量构效关系研究(Quantitative Structure-Activity Relationship, QSAR)是目前化学计量学和化学信息学研究中的重要热点之一,它主要应用各种理论计算化学和统计学方法研究化合物的结构与其活性之间的关系。本论文从分子结构的定量描述和结构性质定量关系的建立入手,总结了QSAR方法在药物分析和设计方面的应用。同时,着重讨论了遗传算法跟支持向量机(GA-SVM)耦合,遗传算法跟神经网络(GA-ANN)耦合和对接为基础的活性构象选择应用到QSAR研究中。本论文第一章介绍了目前最为常用的计算机辅助药物设计方法:定量构效关系和分子对接,介绍了它们的基本原理和研究现状,详细描述了QSAR和Molecular Docking实现步骤以及其中牵涉到的一些问题,并对这一研究领域的最新研究进展进行了总结和展望。本学位论文从分子结构的定量描述与活性定量关系的建立入手,探索了多种方法在QSAR建模中的应用,主要进行了以下三方面的研究工作。具体研究工作包括:1.应用QSAR方法研究了30种抗生素类化合物与DNA相互作用的作用模式、作用常数与1777种抗生素的结构参数之间的定量构效关系。我们将遗传算法(GA)和支持向量机(SVM)耦合来解决结构参数集维数较高问题,GA-SVM方法能选择最优的特征子集和最优的SVM参数,使特征子集和SVM参数同时达到最优状态,从而能够全面准确的建立抗生素类化合物的结构与其活性之间的定量构效关系模型。首先用GA-SVM建立一个二维定量构效关系模型来研究抗生素类化合物与DNA相互作用的作用模式与其结构之间的定量构效关系。其次用GA-SVM建立了两个经典的定量构效关系模型来研究抗生素类化合物与DNA相互作用的键合亲和力常数值与其结构之间的定量构效关系。本研究的目的是建立准确可靠的定量构效关系模型来预测抗生素类化合物与DNA相互作用的作用模式和键合亲和力常数值,同时通过分析筛选出的结构参数与作用模式和键合亲和力常数值之间的联系探索其中的机制,为高效的DNA键合药物的设计提供有用的信息。为了比较GA-SVM方法的优劣,还使用神经网络(ANN)方法建立QSAR模型,通过模型统计参数分析,表明GA-SVM方法构建的QSAR模型泛化能力好。2.建立了预测30个(V600)EBRAF抑制剂的IC50值的QSAR模型。在本工作中,将分子对接和定量构效关系结合起来,以对接为基础的活性构象选择应用到QSAR研究中。分子对接用来研究配体-受体间的结合模式并产生数据集的生物活性构象,基于对接产生的活性构象进行定量构效关系研究,再将GA和ANN耦合建立QSAR模型预测(V600)EBRAF抑制剂的IC50值,并研究影响(V600)EBRAF抑制剂活性的结构因素。结果显示以对接为基础的活性构象选择策略运用到(V600)EBRAF抑制剂的QSAR研究中是合理的和有效的。3.研究了一系列9取代芳基嘌呤衍生物结构与其对Coxsackie virus type B3 (CVB3)病毒抑制活性之间的定量构效关系。将遗传算法与支持向量机耦合(GA-SVM),将主成分分析与神经网络相结合(PCA-ANN),分别用(GA-SVM)和(PCA-ANN)方法建立QSAR模型。本文的目的是建立定量结构-抑制活性模型来预测9取代芳基嘌呤(9-Arylpurines)衍生物对Coxsackie virus type B3 (CVB3)病毒抑制活性;同时,寻找对9取代芳基嘌呤(9-Arylpurines)衍生物抑制活性起决定作用的重要分子结构特征。模型预测结果显示GA-SVM模型的预测能力较好。这是因为GA-SVM方法能同时优化特征集和SVM参数,使两者同时达到优化状态。