论文部分内容阅读
分子描述符的计算是定量构效关系(QSAR)研究的基础,也是化学计量学研究的重要内容,在药物化学、环境科学等领域应用广泛。目前可计算的各种分子描述符已超过4000种,如何选择合适的分子描述符成为QSAR研究中首先要做的事。范数指数描述符由本课题组提出,主要是从原子水平上找到描述分子结构的一种方法。为了探究和验证范数描述符的广义性和普适性,本工作主要进行以下五个方面的研究:1.将范数描述符应用于抗HIV整合酶抑制剂和逆转录酶抑制剂的构效关系研究。所涉及到的抑制剂包括抗HIV整合酶抑制剂、逆转录酶抑制剂、整合酶和逆转录酶抑制剂;所建立plC50和pCC50模型的统计参数为:整体回归的相关系数平方值分别为0.8750和0.9109,留一法交叉验证的相关系数平方值分别为0.8702和0.8914。验证结果表明,所建立的模型在统计质量和预测能力上都是稳定可靠的,并从所建立的模型中推导出具有高活性和低毒性的潜在双靶标抑制剂;分子对接结果表明,这些抑制剂可以通过氢键与整合酶和逆转录酶中的一些重要残基相互作用,因此,本课题组提出的范数描述符以及双靶点模型在双靶点抗HIV药物的研究与开发具有一定的指导意义。上述研究表明范数描述符在抗HIV药物研究与设计中具有很好的应用前景。2.将范数描述符应用于碳纳米管的构效关系研究。碳纳米管具有吸附有机污染物的能力,在生态环境中发挥着重要作用,而这一能力也可能会对碳纳米管在水生环境中的分散产生很大影响。本工作对具有logK∞的分子,具有logKsA的分子和具有logCmax的分子进行建模研究。根据建立的模型可得这三种模型整体相关系数的平方分别为0.9516,0.9362和0.9533,留一法交叉验证的结果分别为0.9440,0.9179和0.9357。结果表明本研究提出的方法可以得到稳定预测模型,表明本工作提出的范数指数在纳米技术中有着广阔的应用前景。3.将范数描述符应用于糖基表面活性剂的构效关系研究;所包括的样本为83个糖基表面活性剂的临界胶束浓度。根据所建立的模型显示,该模型的相关系数的平方为0.9545,训练集和测试集的相关系数的平方分别为0.9591和0.9455。统计结果表明,该模型能为整个数据集、训练集和测试集分别提供满意的预测结果,验证结果进一步证明了该模型的稳定性和稳健性,因此,采用范数指标描述符的模型对临界胶束浓度的预测是有效的。4.将范数描述符应用于纳米材料的构效关系研究。本工作对108个纳米材料在胰腺细胞线中的细胞提取进行建模研究。所建立模型的训练集和测试集的相关系数的平方分别为0.9006和0.9210,表明该模型在计算和预测上都具有很好的精度。此外,交叉验证,应用域分析以及和前人工作的对比进一步证明了该模型的稳定性和准确性。因此,本课题组提出的范数描述符在纳米材料中有着广阔的应用前景,本文所建立的模型可为虚拟筛选磁荧光纳米粒子表面修饰剂提供一些有价值的线索。5.将范数描述符应用于混合物闪点的构效关系研究。闪点是石油化工过程和功能材料设计领域中描述任何可燃材料火灾危险性的重要参考指标。本工作对混合物的闪点进行构效关系研究;所涉及到的混合物有纯组分、二元系统和三元系统;所涉及到的数据点共有1380个。本文提出了一种新的分布构效方法,并基于杂化范数建立了预测闪点的统一的模型,并用一系列验证指标进行了统计验证,验证结果表明该模型在预测多组元混合燃料中具有良好的预测和推广能力。本文提出的新方法和杂化范数能有效地解决结构与FP的关系,在化工过程安全中有较大的应用前景。五组工作所得到的结果都显示本工作所提出的描述符是有效的,而且与文献工作进行对比,表明我们新提出的方法可以更加有效的对不同物性进行预测,精确度有了较大的提高。本组的描述符都只是基于分子结构提出的,无需依赖其他基础数据,由此可见,范数描述符具有广义性、准确性和普适性。