基于集成卷积网络的蛋白质相互作用位点预测方法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:jerrykfczz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是组成人体一切细胞、组织的重要组成成分,是生命活动的重要物质基础。然而,生物体内功能的发挥不是凭借单个蛋白质独立执行的,而是通过蛋白质与蛋白质的相互作用来实现的。如果蛋白质相互作用发生了异常,将会影响到细胞的活性及其功能的发挥,从而引发各种疾病。对于蛋白质相互作用,从本质上来讲,其是通过蛋白质上的部分残基(脱去水分子的氨基酸)的相互结合来实现的,这些残基被称为蛋白质的相互作用位点。而本文的研究内容主要是预测蛋白质上的哪些残基参与了蛋白质的相互作用。该研究对理解生命活动的机制、探究蛋白质相互作用原理、发现新的药物靶标蛋白相互作用关系等相关的研究有重要的影响和意义。对于蛋白质相互作用位点预测的研究,采用生物实验的方法,不仅周期漫长而且要消耗很大的人力物力。因此,计算方法来预测蛋白质相互作用位点则成为当下的主流方法。迄今为止,已有大量的计算方法被提出来预测蛋白质相互作用位点,但是预测的结果与传统的实验方法相比,还有相当大的差距。在这种情况下,就需要有新的计算方法能不断提高蛋白质相互作用位点预测的精度,这也是促使本文研究的动机。总结以往对蛋白质相互作用位点预测的计算方法,其中有很多研究往往存在以下问题:(1)他们往往会取多个相邻残基的特征信息,然后对它们一维向量化,再输入到不同的学习算法中。但是,这种一维向量化操作破坏了残基之间的上下文关系,从而丢失了一些重要的特征信息。(2)以往的方法使用的大多数机器学习方法不具备学习残基的上下文的能力,则导致预测的结果不理想。(3)以前的方法会将不同性质的特征无差别的组合在一起送入算法中学习,但考虑到不同性质的特征在生物表达上的差异,这些特征被无差别的组合可能会影响原本特征的显著性。针对以往预测方法存在的不足,本文提出的解决方案:(1)本文首先提出了特征图的概念来表征残基的特征信息,其中特征图中不仅含有残基的原始特征信息,而且还含有残基的上下文特征信息。本文构建的特征图有PSSM进化特征图、PhyChem物化特征图、PSAIA结构特征图。(2)本文使用了深度卷积神经网络来学习本文构建的特征图,其中卷积神经网络的局部连接和权值共享的能力则可提取特征图的上下文关系和残基的特征信息,除此之外,深度卷积则可提取特征图中的高维抽象信息。(3)考虑每类原始特征在生物上表达的不同,对于基于不同原始特征构建出的特征图,本文对它们分别训练深度卷积神经网络学习器,然后使用集成学习将它们集成在一起,则可避免不同性质的特征无差别的组合的影响,同时也可提高模型的预测能力。为了验证本文提出的ConvsPPIS预测方法的性能表现,本文提取了两个蛋白质相互作用数据集及计算了相应残基的对应标签。同时本文对ConvsPPIS的模型框架的一些重要参数进行了寻优实验。最后,在与以往的一些计算方法对比中,实验结果表明ConvsPPIS模型的预测性能更优。其中,ConvsPPIS的准确率为88%,召回率指为59%,精确率为85%,F1分数为69%,马修斯相关系数为65%。最后,为了测试ConvsPPIS方法的泛化能力,本文在一个独立测试集上验证了它的性能表现,结果表明其要优于其它的对比方法,其准确率为70%,召回率为54%,精确率为40%,F1分数为46%,马修斯相关系数为26%。最后,由于ConvsPPIS方法优秀的性能表现,其将会对以后蛋白质相互作用位点的研究具有一定的借鉴意义。
其他文献
中药翻白草是蔷薇科委陵菜属植物翻白草(Potentilla discololor Bunge)的全草。前期基础和临床研究表明其具有治疗2型糖尿病作用,极具开发前景。但其安全性不明确,不能确定临
大量研究表明,女性妊娠期饮酒可导致胚胎发育异常的机率增多。前期研究已证明了酒精对胚胎各阶段发育的影响。胎盘在哺乳动物发育中承担氧气和营养物质的交换及产生维持正常妊娠所必需的各种因子和激素的作用。但长期以来,早期胚胎的酒精暴露对胎盘发育产生的长期影响尚不清楚。为进一步阐明胎盘在酒精导致胚胎发育异常中的角色,本研究利用胚胎体外培养和移植技术,研究了来源于植入前酒精处理的胚胎发育至13.5天时期胎儿的胎
目的:1.探讨腰椎间盘突出症患者力敏腧穴的分布规律及其敏化特征,为临床针灸治疗腰椎间盘突出症提供选穴依据。2.观察针刺力敏腧穴治疗腰椎间盘突出症的临床疗效,为临床治疗腰椎间盘突出症提供一种新思路。方法:本研究分为力敏腧穴规律研究和前瞻性随机对照研究两部分,具体如下:第一部分:将240名符合纳入标准的腰椎间盘突出症患者作为本次研究对象,按照力敏腧穴探查标准,对相应部位体表腧穴进行探查。随后根据穴位敏
我的毕业创作是以花卉植物题材为表现主题的创作,本文主要叙述我在创作过程中结合自己学习的知识和经验得到的感悟,并通过各方面的探索将其与自身艺术实践结合,从而整理出在油画创作过程中的体验与反思,通过对油画表现性语言的学习,结合自身绘画过程中获得的感悟,并将其记录下来,希望能对我以后的绘画创作有一定的启发。
目的:分析前列腺穿刺活检病理与根治性切除术后病理分级的一致性情况,探讨术后病理升级的危险因素,并建立预测术后病理升级的模型,从而对前列腺癌患者的管理起一定指导意义。方法:回顾分析我院2014年1月至2018年12月行前列腺穿刺活检并于我院行前列腺癌根治术的174例;根据活检病理与术后病理的关系,将其分为降级组/一致组/升级组(A/B/C)。分别分析A+B组、B+C组患者活检病理与术后病理Gleas
大容量变换器,尤其是额定电压在3-10k V,容量在10-200MW的超大容量变流装备,在国防建设、大型工业生产中占有重要的地位,是大型风洞、船舶电传、钢铁轧钢、矿井提升、铁路牵
花生作为四大油料作物之一,最主要的用途是榨油,因此产油量的高低直接决定了花生的价值。提高花生子仁含油量是花生育种工作的重要目标之一,而阐明油脂的积累特征是研究其生理生化机制的基础。本研究选用高油品系农大D666及双亲丰花2号和Krapt.st.16以及高油品种Q6K16-02、低油品种花育17为材料,研究其子仁生长发育过程中脂肪、蛋白质和可溶性糖三大营养物质积累变化特征,分析子仁脂肪积累的关键时期
左权民歌是山西民歌中的重要代表之一,其创作来源于劳动人民,题材内容广,旋律性强,不仅有着浓厚的中国传统民族民间音乐风格特点,还有其自成一派的风格与内涵,吸引着大量优秀的词曲作家对这类民歌进行改编创作。《一铺滩滩杨柳树》原是山西左权县的一首民间情歌,后经皇甫束玉等艺术家进行创作改编,形成了现有版本,极具代表性。以其为研究对象,对歌曲进行详细地分析与研究,探索左权民歌《一铺滩滩杨柳树》中的风格特点。文
本文主要研究了一类具有阻尼项和各向异性非线性增长条件的抛物型偏微分方程问题,其非线性为带有变指数的局部、非局部乘积形式的内部源和吸收源。我们运用抛物型方程的基本
随着轻量化概念的提出,结构的拓扑化技术日益受到国内外研究人员的重视,该技术可以在结构基本构型未知的情况下实现结构的合理设计,增大材料的利用率,所以连续体的拓扑优化得