基于改进BP神经网络预测蛋白质二级结构

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:j19871010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质结构预测在生物信息学研究中占有重要地位,而蛋白质二级结构预测是蛋白质结构预测的关键步骤。本文结合氨基酸序列的编码方式,介绍了几种改进BP算法在预测蛋白质二级结构中的应用,并对网络的学习过程及结果进行分析和评价。主要研究内容及成果如下: (1)首先了解蛋白质一级及二级结构的种类,并掌握其表示方法。从蛋白质数据库中随机选取58条蛋白质,对它们的氨基酸序列和对应二级结构特征进行提取和表示,为整个研究提供了原始数据; (2)对已获取的氨基酸序列及其二级结构进行编码,为神经网络训练和测试提供输入、输出数据。设计编码方法时,考虑其可能对神经网络的结构、运算能力以及最终预测精度的影响,提出了4种氨基酸序列的编码方式,讨论它们结合神经网络预测蛋白质二级结构时存在的问题及优点; (3)基于标准BP算法在预测时存在的缺陷,介绍了3种改进BP神经网络,从原理出发分析了它们改进的具体内容、改进以后可能出现的特点以及相比较于标准BP算法有哪些优点; (4)结合各种编码方式和不同神经网络实现蛋白质二级结构的预测,给出各种组合下得到预测结果并予以分析。提出一种新的改进方法,即遗传算法结合动量法与学习率自适应调整策略的BP神经网络。实验表明,基于正交编码方式的这种神经网络预测可以得到较高的准确度,可将蛋白质二级结构的预测准确度提升到74.35%。 本课题得到了国家自然科学基金(NO.60234020)的支持。
其他文献
近年来迅速发展的无线体域网电子健康系统已经开始表现出会给未来医疗健康产业带来巨大变化的潜力。该系统通常由一个控制主节点和多个微型传感器从节点构成,这些从节点监视不
随着计算机技术和三维可视化技术的发展,计算机辅助诊断技术(CAD)广泛应用于临床诊断和术前手术规划中。CAD技术的广泛使用能够提高医生诊断的准确率。CAD技术的出现,为临床诊断
本文以瓦轴集团特种轴承寿命实验机的设计为背景,经过对特种轴承寿命实验机的设计及其实现过程,通过对特种轴承的技术要求进行详细的分析后,给出了基于PLC的轴承疲劳寿命实验
本论文分析与比较了现有的几种无功功率理论,对时域和频域的一些分析方法进行了探讨.并讨论了无功的各种定义的适用条件和任务.小波理论是一种强有力的数学分析工具,在高速A/
随着计算机集散控制系统的应用和发展,工业生产过程中越来越多的变量能够得到快速监控和处理,现代工业系统也因此朝着复杂化和智能化的方向飞速发展。为了保障设备运行的安全性
现场总线技术是当前自动化领域发展的热点之一,以它为基础产生的现场总线控制系统正在逐渐成为控制系统的主流。其中的基金会现场总线具有良好的发展前景,它是在过程自动化领
多电机驱动系统的协调控制广泛应用于各类精密机械加工、编织、缠绕及轧钢等机电一体化设备的自动控制.随着相关设备的自动化水平及生产工艺要求的不断提高,现有的传动与控制
目标检测是模式识别与计算机视觉中一个重要的领域。在复杂的现实场景中,由于存在遮挡,光照变化,尺度和视角变化甚至相似结构的背景噪声,同一类的物体往往表现出巨大的视觉差异,这
现场总线技术具有数字化、全分散性、开放性和互操作性等特点,代表了今后工业控制网络发展的方向。将以太网技术应用于自动化领域,是现场总线技术的发展趋势。本文着重研究了PR
本文首先介绍中国通信标准化协会制定的第三代移动通信标准和中国网通集团第三代移动通信网络管理系统规范。作者主要参与了网通3G网络管理软件GUI的详细设计。该设计在原有