基于SVM的结合肽预测算法及系统实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:liongliong505
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物恐怖主义、艾滋病及抗生素抵制的威胁,在过去的十年,对疫苗研究的关注在不断增长。MHCⅠ类结合肽可以激活细胞霉素T细胞,MHCⅡ类分子结合肽则作用于免疫反应的开始、促进和抑止过程。MHC结合肽是识别T细胞的先决条件,因此MHC结合肽的预测具有非常重要的理论意义与实用价值。   本文主要完成了下面工作:1.完成了结合肽预测系统的数据处理工作,包括数据的获得、层次结构的抽取以及MHCⅡ类的不等长结合肽的预处理等;制定肽序列特征提取的规则,根据结合肽和非结合肽各位点氨基酸的频率信息计算各类MHC分子的结合度矩阵和相对差矩阵,并基于相对差阈值选取适当的结合度值作为序列的主要特征;使用这些特征对序列集进行向量化。2.对支持向量机(SVM)方法用于结合肽的预测进行研究和探讨,构造了一个层迭式增量SVM。初步实验表明该层迭式增量模型在结合肽预测方面相对普通的SVM模型、以及常用的MHC预测算法SVMHC和SYFPEITHI有更好的预测准确率。通过测试数据集大小对试验结果的影响,为层迭式增量SVM训练时增量集大小的选取给出了参考意见。3.开发完成了一个结合肽预测系统,可提供基于web的预测服务。并设置 了三个可选的训练方式,对每个MHC类型,可使用层迭式、固定式和随机式三种模式分别训练得到不同的模型,从而得到不同精度的预测结果。   本论文得到国家自然科学基金项目“基于网络环境的生物信息学研究和示范显示”(B1-137-040130)的支持。该系统在结合肽预测方面具有一定的应用价值。
其他文献
  随着互联网的日益发展及人民生活水平的逐步提高,人们接触视频信息的机会越来越多。如何对数量巨大的视频数据进行高效管理,以便能快速准确地获取用户所需视频,成为当前信息
Internet的迅速发展,促使网络日趋复杂、规模不断扩大,人们对复杂、异构网络的管理要求也越来越高。当前大多数网络管理系统都是基于SNMP协议的集中管理模式,此类系统实现起来比
本课题目标是完成一套基于Windows操作系统的支持隧道代理的主动防御型防火墙的应用代理和内容过滤软件的设计与实现,为在内部网的主机提供安全保护.首先,论文陈述了防火墙的
随着网络应用的不断普及,认证技术作为分布式系统和CS方式系统的首要安全技术得到了迅速的发展。从目前的应用来看,一次性口令(One-timepassword,简称OTP)认证系统和基于证书的
数据挖掘是从海量数据库中发现人们感兴趣的、隐藏的、前所未知的知识。它涉及数据库、人工智能、机器学习、模式识别、知识工程、面向对象、信息检索和可视化等一系列技术。
随着网络技术及电子商务的飞速发展,企业信息系统日益占据着企业竞争优势的主体地位。数据的海量增长,使企业比以往任何时候都更加依赖于数据。因此,数据存储的可用性、完整性和
  中间件屏蔽了底层操作系统的复杂性,使程序开发人员面对一个简单而统一的开发环境。然而传统的面向对象中间件因为具有明显的封闭性和专用性,因而缺乏有效的QoS的支持,不能
随着下一代网络NGN(Next Generation Network)不断发展和日趋成熟,作为其核心部分的网络软交换技术也越来越受到人们的关注,网络软交换将成为下一代分组交换网络的核心组件之
工作流管理系统 WFMS(WorkFlow Management System)是计算机集成制造系统及企业资源规划研究领域的一个重要分支,它已经被实践证明能够大大提高管理过程的效率,所以已经被广
随着全球性的网络化、信息化的不断发展,电子政务成了继电子商务之后信息技术应用的又一个热点。本论文的基本研究内容来源于全国公安消防部队人员管理信息系统,它是电子政务的