论文部分内容阅读
在体液免疫过程中,B细胞表面受体(BCR)会识别外源抗原蛋白,并产生与抗原蛋白特异性结合的抗体,同时一部分B细胞会被激活分化成为记忆B细胞,并在下次病原体侵入体内时产生更加迅速的免疫应答。抗原表面被B细胞表面受体识别并与抗体特异性结合的区域称为B细胞表位。定位抗原表面B细胞表位对于设计人工疫苗、免疫干预治疗以及高通量的抗体制备而言都具有重要意义。目前,定位B细胞表位最可靠的方法是通过抗原-抗体复合体晶体衍射实验以及核磁共振的方法获得复合体的空间结构。然而这两种实验的方法都需要很高的成本以及大量的人力并且对于设备的要求也很高。随着一些辅助的实验手段的发展以及已知表位数据的增加,人们开始考虑使用计算机进行表位预测。通过预测的方法获得的候选表位可以通过后续的生物实验进行验证。使用这种实验和计算机相结合的方法既可以保证结果的准确又可以节约成本,提高工作效率。基于噬菌体组合肽库筛选的B细胞表位预测是实验方法和计算方法相结合的一种B细胞表位预测方法。方法首先通过噬菌体组合肽库筛选实验获取与抗体亲和度较高的模拟表位序列,然后利用这些模拟表位序列在抗原表面搜索与之相匹配的氨基酸预测候选表位。近年来,随着噬菌体组合肽库筛选获得的模拟表位序列数据和抗原-抗体复合体三维结构数据的不断增长,许多基于噬菌体组合肽库筛选的B细胞表位预测方法被提出,并在几个测试例上运行都得到了较好的预测结果。然而到目前为止,在基于噬菌体组合肽库筛选的B细胞表位预测方面还没有一个通用的标准测试集,同时对算法间性能的分析比较也没有一个完全的评价体系。本文的研究工作主要包括构建基于噬菌体组合肽库筛选的B细胞表位预测标准测试集、建立算法间性能的评价体系、提出更加敏感的基于抗原结构信息和噬菌体组合肽库筛选的B细胞表位预测新方法。首先,本文在对现有的基于噬菌体组合肽库筛选的B细胞表位预测方法研究基础上,整合了MimoDB、PDB、CED和IEDB 4个数据库中的相关信息,构建了一个通用的标准测试集。使用标准测试集及其代表测试集对Mapitope、PepSurf、Pepitope、Pep-3D-Search和EpiSearch 5个公开发表的基于噬菌体组合肽库筛选的B细胞表位预测方法进行了测试,这5个算法或提供源码或提供免费的网络服务。文章通过标准测试集及其代表数据集,并使用敏感性、特异性、准确率和马氏相关系数4个评价参数为基于噬菌体组合肽库筛选的B细胞表位预测方法建立了一个全面的评价体系,并对5个算法的性能进行了综合的评价分析。在综合评价分析基础上,本文提出了一种更加敏感的基于抗原结构信息和噬菌体组合肽库筛选的B细胞表位预测方法。算法首先根据结构特征并使用支持向量机对抗原氨基酸进行分类,实现对抗原的预处理;然后在现有表位预测算法的基础上引入划分的思想,通过将抗原表面氨基酸划分成若干交叠的patch区域进行表位预测。在为每一个patch构建无向图的过程中,算法首次尝试使用可变的距离阈值来定义无向图中顶点的连接。此外,本文第一次采用完备的搜索方法保证了搜索的路径最优。最后,通过与其它5个算法的测试结果进行比较验证,本文提出的算法的敏感度有很明显的提高。本研究不仅对B细胞表位预测方法的理论研究具有重要意义,同时也将推动其向实用方向发展。