混合核函数SVM的蛋白质相互作用预测方法研究

来源 :福州大学 | 被引量 : 2次 | 上传用户:leoncici617
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类和其他生物物种的测序计划的完成,人类对生物及生命科学研究开始从基因组时代进入后基因组时代,并将研究的重点转移到以蛋白质相互作用研究为中心的蛋白质组学上。蛋白质主要通过与其他蛋白质或生物大分子间的相互作用实现其功能,那么对蛋白质相互作用的进一步研究将促进人类对生命活动及蛋白质功能的认识。随着近几年生物实验技术的迅速发展,人类开始采用各种生物实验方法来研究蛋白质的相互作用,但是由于受到当前生物实验技术耗时耗力的约束及高通量实验技术在检测出大量蛋白质相互作用的同时,也会带来了很多“假阳性”和“假阴性”数据。因此,本文从计算的角度来对蛋白质相互作用进行探究,主要研究了蛋白质相互作用位点及相互作用对的预测方法。本文的工作主要包括以下几个方面:为了进一步提高蛋白质相互作用位点预测的准确率,采用滑动窗口技术结合以高斯核和多项式核为基核的混合核函数SVM,充分考虑了相邻或相连蛋白质残基的影响。同时采用Bootstrap采样方法将蛋白质相互作用位点的不平衡数据转化为平衡数据问题,并将改进后的粒子群算法应用到以混合核函数SVM为基学习器的选择性集成算法中,进一步提高集成的效率和预测的准确率。真实的数据集测试表明本文提出基于混合核函数SVM的选择性集成算法的蛋白质相互作用位点的预测方法能够得到更好的预测效果,与其他方法相比能有效提高蛋白质相互作用位点预测的准确率。随着生物学研究的不断深入,在蛋白质相互作用对的预测问题上,生物实验方法造成的噪声和蛋白质相互作用数据集的固有缺陷导致基于常规SVM核函数的蛋白质相互作用预测方法出现问题。因此,为了进一步提高蛋白质相互作用预测方法的准确率,提出了一种以余弦核和线性差值累加核为基核的对偶混合核函数SVM的蛋白质相互作用预测方法。该方法充分考虑了蛋白质的结构域特征,同时根据蛋白质相互作用数据应具有顺序无关的特点,将“对偶”思想引入SVM核函数中。对两个真实的蛋白质相互作用数据集Yeast PPI和Human PPI的测试结果表明,本文的方法与其它方法相比能够有效地提升了蛋白质相互作用预测方法的准确率。
其他文献
本文首先根据自动站资料的特点,设计了一个自动站资料质量控制方法,利用格式逻辑检查、气候极值范围检查、时间一致性检查、空间一致性检查等方法对2012年辽宁省自动站资料进
根据双交叉积理论,一个Hopf代数E可以分解为A和H当且仅当E同构于A和H的某些双交叉积[1].本文描述了32维Hopf代数H8(?)HH4的双交叉积,并对其进行了分类.最终得到在Hopf代数同
认知控制是人类的一项重要的认知能力,包含有反应抑制、干扰抑制、认知灵活性三个子成分,对人类的生存不可或缺。当今世界上许多人掌握了双语能力,因此双语经验及其带来的优势效应得到了越来越多的关注度,在当下有诸多的心理学研究例证有力地证明了,双语经验能够对个体自身认知控制系统中不同的子成分起到正向的促进作用。同时,各不相同的情绪情感性因素对于个体自身认知控制系统所造成的影响现如今学界还未产生出统一的定论。
学位
果蝇的小眼发育一直被当做研究神经先分化,细胞命运决定,细胞之间的交流等方面的经典模型。每一只完整的果蝇复眼都是由750-800个相对独立的小眼通过有规律的分化完成,形成非
量子纠缠作为量子信息的基本资源而得到广泛的研究,它在量子计算,量子隐形传态,量子通信等领域占据着核心位置。最近研究发现量子纠缠还可以用来提高参数估计精度。然而任何
本文研究四个方面的内容:第一部分研究一类具有反馈控制的非自治两种群浮游生物相克系统.借助于微分方程比较原理和通过构造适当的Lyapunov函数方法,得到了一组保证系统持久和
广义均衡问题(GEP)、分裂可行问题(SFP)是当前非线性分析领域中的热点问题。广义均衡问题的研究在非线性分析理论和应用上非常有意义,它包含了优化问题、变分不等式问题、极
图谱理论是图论及其应用研究领域的一个重要课题,矩阵在研究图谱理论中发挥了重要的作用.张量作为矩阵的一般形式推广,在数学、物理学、力学等方面有着广泛的应用,同时也为一
均衡问题与对策论、物理学和力学、经济与金融、控制与优化问题、算子不动点以及变分不等式理论密切相关。由于它在许多领域有着重要的应用,因此倍受学者们的关注,近年来成为
近年来的研究发现MHC-I(主要组织相容性复合体-I)分子及其受体在胚胎及一些成年中枢神经区域高度表达,对神经纤维的生长和再生、以及突触的可塑性起抑制作用。我们实验室在研