论文部分内容阅读
定量构效关系需要的仅仅是分子的结构信息以及所研究性质的实验数据,通过对计算出来的各种分子结构参数和实验性质进行分析,建立结构参数和所研究的性质之间的定量关系。根据各种建模方法建立可靠的相关模型,依此模型可以进行活性预测,同时根据模型系数找出对分子活性影响比较大的分子结构信息,对分子设计有重要的指导意义。
从多个结构参数或者描述子中选择少数与活性相关的有效变量是定量构效关系研究的一个重要步骤,描述子选择的好坏直接影响着定量构效关系模型的可靠性。本文对怎样选择对分子生物活性有显著贡献的描述子做了深入研究,开发了基于遗传算法实现的广义簇显著性分析方法,通过这种方法能够有效地找到显著性的描述子,对建立定量构效关系模型,设计新分子有指导性的意义。
从数据集中选择样本分子作为训练集也是建立定量构效关系模型过程中的一个关键步骤,训练集与测试集选择的均匀程度影响着模型的稳健性。本文对怎样选择合适的样本分子作为训练集做了研究,引入了洋葱式D-优化试验设计思想,开发了基于遗传算法实现的GA-DOOD程序,能够快速的找到信息量大的分子组合,便于构建定量构效模型。
传统定量构效模型一般都期望获得全局的结构与生物活性之间的定量关系,但是在很多情况下,整个分子集中有一些分子组具有某种与活性相关的特殊特征,代表着局部的结构活性关系。传统的QSAR模型不能识别这种局部的特殊关系,不能获得良好的预报结果。为此本文提出了分组建模的思想,依据分子之间的结构相似性划分为几组,分别建立自组织分子场模型,测试集的归属通过维相关距离来实现。
本论文对定量构效关系中的描述子选择方法、训练集样本选择方法和建模分组方法进行了探讨,应用药物/化合物的构效关系研究,获得了一定的成绩,所建立的相关模型对药物的性成分筛选和药物设计具有一定的指导作用,值得深入研究。可望通过进一步究,为药物分子的筛选及其创新药物设计开辟了一条新的道路。