蛋白质结构预测新方法的研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:wei2006006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息化是现代科学技术发展的重要趋势之一,用化学计量学方法处理化学信号,已成为现代分析化学的一个重要的研究领域。人类基因组计划的实施推动了一门新兴学科——生物信息学的诞生,蛋白质结构和功能预测是后基因组时代生物信息学的重要研究内容,将化学计量学手段应用于生物信息学研究,已成为分析化学工作者面临的一个挑战性的新课题。本文致力于研究化学计量学中支持向量机、遗传算法、蚁群算法、小波变换等热门方法在化学生物信息处理中的应用,建立了一系列的化学生物信息处理新技术,包括蛋白质二级结构含量预测、结构类预测、家族模体预测、化学信号去噪等几个方面,其主要内容如下: (1)结合氨基酸对耦合组成和支持向量机,提出了预测蛋白质二级结构含量的新方法。与传统的氨基酸组成相比,氨基酸对耦合组成加入了一定量的氨基酸残基的排列信息,定义简单和计算方便;同时,支持向量机具有可调参数少、收敛速度快的特点。对三个相互独立的非同源蛋白质数据集进行了自检验和交叉验证,预测结果明显优于文献值。因此,本文提出的预测算法不仅易于实现,而且可以提高蛋白质二级结构含量的预测精度。 (2)提出了预测蛋白质结构类的新方法。本文定义了一种新颖的伪氨基酸组成,用于表征蛋白质样本,结合支持向量机,对蛋白质的结构类进行了预测。对文献中常用的一个非同源蛋白质的数据集进行了自检验和留一法检验,预测结果得到了显著改善。在此基础上,本文还提出了基于支持向量机的双层融合网络。网络的第一层包含三个单一的分类器,分别由不同的特征参量洲练所得,即蛋白质的传统氨基酸组成、氨基酸对耦合组成和伪氨基酸组成。 它们的计算输出经过合并,输入到网络的第二层支持向量机,由其得出最终的分类结果。对Zhou选取的两个非同源蛋白质(域)的数据集进行了预测,结果表明预测成功率有了显著提高。 (3)将遗传算法的种群思想移植到传统的蚁群算法,提出了混合型的蚁群算法。数值实验结果表明,该算法可以较好地处理连续空间的优化问题。进一步应用该算法搜索蛋白质小波功率谱中的最优分解尺度,较成功地解决了连续小波变换法对蛋白质的二级结构连接多肽、α螺旋进行预测时最优分解尺度的选择问题,在蛋白质结构预测中具有广阔的发展前景。 (4)通过结合快速退火演化算法和协同方法,提出了协同快速退火演化算法,用于求解高维的全局优化问题。该算法通过分解原来问题的解空间,在每个子空间里用单个独立的快速退火演化算法搜索最优子解,因此求解问题的速度得到明显提高。进一步用该算法提取EGF蛋白质家族的模体,所提取的模体与蛋白质功能位点数据库PROSITE中的结果相吻合。 (5)将分形理论与小波包滤波相结合,提出用分形盒维数来评判信号曲线的滤波情况。随着小波包分解尺度的增大,滤波后信号曲线的盒维数逐渐减小,并最后趋于稳定值。因此,可以根据盒维数一分解尺度曲线来选择最佳分解尺度。对仿真含噪信号进行了滤波实验,结果表明:即使在信噪比低至0.5时仍能得到较好的结果,并且该法用于毛细管电泳实验数据的处理结果同样令人满意。 以上化学生物信号处理技术都已编写了完整的处理程序,可以极为方便地使用。本文系国家自然科学基金、广东省自然科学基金和广东省科技计划资助项目。
其他文献
聚酰亚胺以其突出的综合性能广泛应用于航空、航天、汽车、电子等高科技领域。近年来聚酰亚胺及其复合材料已成为广大学者研究的热点。通过填充纤维、刚性颗粒等填料的改性手
当今世界化石能源日益枯竭以及全球环境问题日益严重,为利用可再生能源实施可持续发展战略,清洁能源尤其是氢能源越来越受到重视。电解水是非常成熟的制备高纯氢和氧的技术,固体
多年来,低维石墨相碳基材料的常规加热方法存在着高耗能、长耗时、气氛要求苛刻等缺点,大规模合成具有较高性能的低维石墨相碳基材料显得较为困难。在不断对低维石墨相碳基材料进行形貌调控、掺杂、复合以增强其性能的同时,寻找一种新型合成手段也成为研发材料并投诸于实用的有效手段之一。通过微波直接加热反应体系的微波合成方法逐步进入了研究人员的视野。本论文采用微波法作为研究的主要合成方法,分别探索了微波法在g-C_