基于序列和结构特征的蛋白质结合自由能预测

来源 :广西大学 | 被引量 : 0次 | 上传用户:fenghuah
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生命的基础物质,构成细胞的基本有机物,是生命活动的主要承担者。蛋白质不仅与其它化合物结合,蛋白质自身结合也有重要的意义,蛋白质与蛋白质之间的交互对生命活动有着重要的作用。当一对蛋白质之间的结合自由能的值很大的时候,说明这一对蛋白质在药物设计阶段能够成功结合并对生物产生作用,从而更好的治愈疾病。反之,将它们结合为药物就几乎毫无意义。回归分析是一种应用十分广泛的数据分析方法,擅长用观测数据内在规律,分析数据变量间的依赖关系,尤其是在定量预测上应用更多。建立准确的回归模型来预测蛋白质间的结合自由能是一种很好的途径。因此,选择有价值的特征集和回归模型是本文的研究重心,根据有价值蛋白质的特征来预测蛋白质之间的结合自由能可以完善蛋白质相互作用设计,对于推动蛋白质对接研究的进步,加速针对蛋白质相互作用的药物设计开发,高效治疗疾病是有重要的作用。目前有很多计算蛋白质结合自由能的方法,但这些方法计算需要大量的时间和资源,并且无法得到较高的准确率,从而很难被直接应用到实践中。本文旨在设计准确,快速计算的模型来预测蛋白质结合自由能,主要研究工作如下:(1)收集并计算与蛋白质结合自由能相关的序列特征和结构特征、135对蛋白质复合物当做训练集、39对蛋白质复合物当做外部集。(2)使用最小冗余最大相关(mRMR)来选择那些与蛋白质自由能显著相关的特征并去除冗余特征,从而得到最小冗余最大相关的特征集,然后把这特征集用于建立6种回归模型。(3)对于6种回归模型通过10折交叉验证对比得到最佳回归模型,然后通过模型特征优化得到最佳特征集,并对优化后的特征集进行移除特征来对比分析特征的重要性。(4)用优化后的特征集建立最佳回归模型来预测蛋白质结合自由能,将模型预测的性能与别的方法进行构象变化和外部集验证对比。实验结果表明,本文使用Linear Regression和SMOreg回归模型相结合来预测蛋白质结合自由能,优化后得到的最佳回归模型比其它方法的模型具有着更高的性能,并且也适用于那些构象变化较大的蛋白质。
其他文献
随着语音通信技术的进一步发展,对语音在接收和处理讯息方面的要求越来越高,语音辨别、语音增强及目标声源的定位等应用已经成为了研究热点之一,然而目标声源的定位是完成语
随着人们对环境保护的日益关注,减少污染物排放和燃料消耗已成为柴油机领域面临的重要挑战之一。燃料的雾化质量直接影响发动机的节能减排效果。本文在研究柴油、汽油混合燃料理化特性的基础上,利用高压共轨定容弹试验系统,研究了燃料性质、喷射压力、喷油脉宽和环境压力对柴油-汽油混合燃料喷雾特性的影响。此外,利用FLUENT计算流体力学软件仿真分析了针阀结构和喷孔角度对喷孔内流动特性和喷雾特性的影响。(1)试验结
琼胶酶是一类能够降解琼胶,生成琼胶寡糖的糖苷水解酶。它降解琼胶产生的琼胶寡糖,具有多种生理活性,在食品、药物、化妆品等领域具有广泛的应用前景。本课题从实验室保藏的
钙钛矿材料由于极好的光电特性,使得其太阳能电池器件的光电转换效率在过去的十年间从3.8%迅速提高到24.2%。甲脒(FA)碘化铅(FAPbI3)钙钛矿材料由于其良好的光捕获性能、极长的载流子扩散长度和优越的热稳定性而更适合光伏应用。鉴于此,本文先后采用3种不同的方法来制备高效率、高稳定性的基于α-FAPbI3的FA基钙钛矿太阳能电池。首先,本文采用“模板辅助法”制备超纯相、高质量的α-FAPbI3
由于储层是非均质的,在相同射孔参数的情况下,必然造成非均质性对不同射孔段和同一射孔层段的影响,其吸水能力是不一样的,油水推进也会是不均一的;在渗透率差异较大的井中,渗
我国钨资源开发利用较早,钨冶炼企业较多。然而到目前为止,我国钨冶炼生产过程的自动化水平仍然较低,只有厦门钨业等大型钨冶炼企业建设了基于DCS系统的钨冶炼生产过程自动控
葡萄花及敖包塔油田位于大庆长垣南部的葡萄花及敖包塔构造上。黑帝庙层发育在嫩江组三、四段地层中,属松辽盆地上部含油组合。其埋深小于700m,为浅层气藏类型。葡浅701井、
目的:通过pAdEasy腺病毒系统构建红色萤火虫荧光素酶报告基因,结合Tat-Ag2S QDs联合标记mMSCs。建立近红外二区荧光和生物发光联合成像技术,并应用于移植干细胞在急性肝损伤
异喹啉酮化合物广泛地存在于自然界,它不仅是构成许多天然产物的基本结构单元,同时它还具有独特的生物活性和药理活性,所以一直以来都是众多化学家研究的热点之一。本文以邻