论文部分内容阅读
随着生物恐怖主义、艾滋病及抗生素抵制的威胁,在过去的十年,对疫苗研究的关注在不断增长。MHCⅠ类结合肽可以激活细胞霉素T细胞,MHCⅡ类分子结合肽则作用于免疫反应的开始、促进和抑止过程。MHC结合肽是识别T细胞的先决条件,因此MHC结合肽的预测具有非常重要的理论意义与实用价值。
本文主要完成了下面工作:1.完成了结合肽预测系统的数据处理工作,包括数据的获得、层次结构的抽取以及MHCⅡ类的不等长结合肽的预处理等;制定肽序列特征提取的规则,根据结合肽和非结合肽各位点氨基酸的频率信息计算各类MHC分子的结合度矩阵和相对差矩阵,并基于相对差阈值选取适当的结合度值作为序列的主要特征;使用这些特征对序列集进行向量化。2.对支持向量机(SVM)方法用于结合肽的预测进行研究和探讨,构造了一个层迭式增量SVM。初步实验表明该层迭式增量模型在结合肽预测方面相对普通的SVM模型、以及常用的MHC预测算法SVMHC和SYFPEITHI有更好的预测准确率。通过测试数据集大小对试验结果的影响,为层迭式增量SVM训练时增量集大小的选取给出了参考意见。3.开发完成了一个结合肽预测系统,可提供基于web的预测服务。并设置
了三个可选的训练方式,对每个MHC类型,可使用层迭式、固定式和随机式三种模式分别训练得到不同的模型,从而得到不同精度的预测结果。
本论文得到国家自然科学基金项目“基于网络环境的生物信息学研究和示范显示”(B1-137-040130)的支持。该系统在结合肽预测方面具有一定的应用价值。