基于SVM的蛋白质二级结构预测

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:weinziel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物数据的大爆发,生物序列的数量在数据库中呈指数形式增长。因此,从氨基酸序列中预测蛋白质的结构和功能,已经成为一个重要的研究问题。直接通过实验的方法确定蛋白质的结构,相对比较低效。对蛋白质二级结构和功能进行预测已成为生物信息学中的一个常用方法。本文围绕蛋白质二级结构编码方式和支持向量机核函数等内容,对蛋白质二级结构预测进行了研究,具体的研究工作如下:(1)给出了一种新的蛋白质二级预测编码方式。首先对氨基酸的理化特性进行主成分分析,提取出主要影响因素,融合成3位编码。然后,在原有3位编码基础上加入3位氨基酸在特定二级结构中的倾向因子。编码完成后,使用支持向量机方法进行预测。实验结果表明,改进后的编码方式优于单纯做主成分分析得到的3位编码和5位编码方式,可以有效地用于蛋白质二级结构预测。(2)对于蛋白质二级结构预测的支持向量机算法,构建出一种新的核函数来提高模型的鲁棒性和泛化能力。通过广义的拉盖尔多项式衍生出三角拉盖尔核函数,并比较三角拉盖尔核函数、RBF核函数和基于高斯的拉盖尔核函数的泛化能力和鲁棒性,实验结果验证了该核函数的有效性。本文通过编码方式和预测方法的改进,提高了蛋白质二级结构的预测结果,并通过实验验证了改进方法的合理性。
其他文献
目的探讨干扰素(IFNs)诱导剂从鼻腔给药,能否诱导呼吸道局部黏膜产生足量干扰素,预防呼吸道病毒感染性疾病。方法选用干扰素诱导剂聚肌胞、新城疫疫苗、阿比朵尔和刺五加多糖溶
湖南省武冈市立足供给侧结构性改革,着眼全局、着手卫生计生、着力村卫生室,"软硬"兼施深化县域医改,逐渐探索形成了"全统筹、补短板"的"武冈经验"。升华和改进武冈经验,需要继续加
拥有良好的饮食习惯,对于身体健康,是绝对错不了的。科学事实证明,吃得健康、科学、合理是增加寿命的重要条件之一。现在不少人都讲究饮食养生,图的是身体健康,更能够延年益寿。并
期刊
基于三维建模软件Solidworks对制浆领域盘磨机常用的3种磨盘进行建模,并使用CFD软件Flowsimulation对这3种磨盘进行了模拟和分析。通过只改变磨盘磨齿的排列方式,对磨盘磨区内
目的探讨男性精浆微量元素含量与男性不育的关系。方法采用原子吸收光谱法、比色法对101例精子数少于20×109/L(精子存活率正常)、128例精子存活率小于50%(精子数正常)的男性
夜光涂层织物是一种新型功能性织物,通过制备非织造夜光涂层织物,分析比较含相同30%(wt,质量分数)发光材料的针织夜光涂层织物与非织造夜光涂层织物的发光性能差异。借助扫描
本文介绍了一种原理上基于Reason模型、应用于制浆造纸企业的设备故障根本原因分析技术,该技术描述了设备缺陷在潜在条件触发、主动失效产生及纵深防御失效时缺陷发展为故障的