论文部分内容阅读
药物的发现、设计和研发是一个代价昂贵并且极具挑战性的工作。医药化学家所感兴趣的不仅仅是识别具有期望药效的特定化合物,更想研究的是究竟化合物的哪一部分产生了所希望的这种药效,以便可以合理的合成新的药物。由于创建模型将化合物正确的分到各种感兴趣的特定类中的计算技术可以弥补这些局限,因此在制药工业中就变的非常流行,于是它成为了一个活跃的研究领域。核函数的使用使得非线性分类问题变得线性可分,在研究了大量计算化合物相似性的核方法的基础上及根据前人的实验结论,明确了研究方向。基本的研究内容及创新主要有:(1)给出了一种基于连接的描述符生成方法及详细的实现步骤,并充分利用生成描述符过程中保存的信息,在计算化合物的相似性时,为不同大小的特征赋予了不同的权值,改进了现有的分类表现较优的核方法,提高了分类准确率;(2)受随机通路核、最优分配核的启发,考虑化合物根据活性进行分类的具体应用,为原子增加了它周围的拓扑信息,提出了自定义图核子结构匹配核。由于化合物的活性与部分结构关系密切,通过控制图中两个中心原子的距离和半径生成子结构对,将图中的子结构对作为图比较的基础,提出了子结构对核。两者都考虑了更多与化合物分类相关的信息,实验结果表明我们的方法等于甚至优于其它现有的方法。对比实验结果表明,我们的方法针对化合物根据活性进行分类这个问题有一定的适用性,因此在类似的分类问题中可以作为参考的方法。