二维HP模型蛋白质折叠性质的改进遗传算法研究

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:b411574103
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质结构预测是生物信息学研究领域的热点问题之一,它是关于如何从蛋白质的氨基酸序列出发来预测它的结构、折叠、功能等问题.本学位论文以蛋白质的亲-疏水(HP)格子模型为对象,结合蛋白质的二级结构和改进的遗传算法,计算了9种不同的蛋白质HP序列,搜寻到它们的最低能量构型,并分析它们的性质.   首先,我们研究了蛋白质的结构模型及其相关的能量函数.探讨如何求解蛋白质结构折叠过程中的能量函数是整个过程的关键问题.综合目前国内外的研究热点,考虑到蛋白质折叠过程综合了热力学和动力学,及其折叠的随机性和过程的复杂性,本文将已有能量函数与HP格子模型相结合,构建了一种简化的能量函数并提出基于二维HP格子模型的二级结构基本构型.   其次,我们研究了遗传算法在蛋白质折叠过程的应用.简单遗传算法并不能保证以概率1收敛到最优解,且人为主观地确定交叉概率和变异概率并不利于最优问题的求解,因此在简单遗传算法的基础上提出了改进的自适应遗传算法,有效地克服了简单遗传算法的不足.我们结合二级结构基本构型,改进了遗传算法盲目搜索策略,改变了原来的随机编码机制,引入对具有连续疏水残基的局部序列进行特定编码方法,并且加入识别遗传操作,及修改相应的交叉、变异,得出有更好适应性的算法,加速算法收敛,得出问题的最优解.   最后,我们对9种不同长度的标准蛋白质HP序列进行数值模拟.实验结果表明,我们的算法不仅计算出比其它盲目随机搜索方法更低的能量值,例如序列长度为20、24、25、36、48、50和60的最低能量我们都能达到跟前人一样,但对于序列长度为64的,前人的最低能量是-39,而我们所得的结果是-42,比前人优越得多.同时,我们还发现了一些有趣性质,比如基态构象的多样性,例如序列(长度为24,50,64,85)的最低构象不止一个;各基态构象与HP模型的二级结构基本构型的相似性以及部分结构具有对称性特点等.结果证明我们的改进遗传算法加上二级结构基本构型进行蛋白质结构预测是合理有效的.
其他文献
原子磁力仪的基本原理是依据Cs原子拉莫尔进动(Lamor Procession)频率正比于外界磁场强度的物理特性,通过检测极化原子进动的频率,从而实现外界磁场的精确测量。2008年,在《MIT Technology Review》(技术评论)中原子磁力仪被麻省理工大学评为未来最有可能改变人类生活的十大新兴技术之一。高灵敏度的磁力仪已经有大量的应用,在地磁考古和生物医学成像方面,搜索中子中的永久电偶
本论文是对激光雷达发射系统展开的模拟预研。设计研究出一台激光二极管泵浦电光调Q的Nd:YAG激光器,并设计加工了一台实验所需要的扩束镜。对电光调Q激光器的性能参数进行了
贺龙是中华人民共和国的开国元勋,一生胸怀坦荡,光明磊落。在“文革”那个颠倒黑白的年代里,贺龙同林彪、江青一伙进行了不屈的斗争,最终被残酷迫害至死,成为“文革”中一桩
党的十六大报告指出:“就业是民生之本”,把办好企业、搞好就业提到了“执政为民”和国家长治久安的新高度,体现了党对“民生”问题的高度关注。如何充分认识和深刻理解关注
贵金属微纳米结构迷人的光学特性自古就引起了人们的广泛关注。这些独特的光学行为与金属微纳米结构形状、尺寸、成分和周围介电环境等密切相关,其根本来源是外部光场激发下
脱氧核糖核酸(DNA)是复杂多样的大分子体系,是生物体中储存和传递遗传信息的重要物质和分子器件材料。DNA是由两条多核苷酸链组成的,这两条核苷酸链通过碱基的互补配对相互缠绕
学位
本文在碱性条件下,以十六烷基三甲基溴化铵为模板剂,使用正硅酸乙酯作为硅源,制备得到了纳米MCM-41分子筛。用三嵌段共聚物聚(EG20PG40EG20)为模板剂,在酸性条件下,以正硅酸
目标或目标结构的机械振动或转动会对雷达回波信号产生额外的频率调制,引起以运动目标体多普勒频率为中心的频带展宽。这种由振动或转动所引起的调制被称为微多普勒效应。微多
在实际的生活中,我们总需要对微弱的磁场进行测量。例如医学中生物体磁场的测量、军事领域中磁力仪可在人造卫星上进行空间探测、地质勘查中地形地貌的研究、工艺加工中材料缺
量子信息是量子力学和信息学结合产生的一门极具发展潜力的新兴学科。人们在实验上和理论上都开展了大量的研究,并已取得了不少的成果。在量子信息领域中,量子纠缠一直都扮演着