基于AFP的序列无关蛋白质结构比对算法研究

来源 :兰州大学 | 被引量 : 1次 | 上传用户:liongliong516
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着被誉为人类科学“登月计划”的人类基因组项目的顺利完成,生命科学进入了一个崭新的时代--“后基因时代”。基因序列的获得一方面为人们理解生物体的奥秘提供了基础,但同时人们也发现单从基因序列的角度并不能完整系统的阐述生物功能。蛋白质是生命体构成的主要成分,同时也是生命活动的主要执行者,对于理解生物体的内在功能具有重要的指导意义。寻找蛋白质结构之间的相似性有利于让人们理解功能之间的相似性,发现远程的同源关系,甚至发现蛋白质结构的进化机制。因此,寻找蛋白质相似性的手段--蛋白质结构比对应运而生,并且发展为生物信息学不可或缺的一种工具。越来越多的蛋白质结构比对算法已经被提出,例如FATCAT,CE等。但是,许多蛋白质结构比对算法都是基于序列性限制的,并不能检测到由于循环置换或是不同祖先进而来的蛋白质结构之间的序列无关相似性。基于上述背景,本文简要的介绍了当前主流的七种序列无关蛋白质结构比对算法,并且提出了一种新的基于变长AFP的序列无关蛋白质结构比对算法。与其他基于AFP的蛋白质结构比对算法不同的是我们的算法采用的AFP是变长的,这样不仅可以更好的表征蛋白质局部结构,而且可以提高运算速率。此外,我们利用AFP的空间信息对AFP进行筛选,剔除含有噪声的AFP,从而获得高质量的AFP。我们将高质量的AFP之间的关系用图论的理论处理,并用这个图的一个优质的最大团来表示初始结构对齐。最后,为了避免动态规划算法在序列无关结构比对中的局限性,我们采用贪心算法对初始对齐进行优化并得到最终的比对结果。实验结果表明,与七种序列无关的蛋白质结构比算法相比,除了含柔性的序列无关结构比对算法DEDAL和考虑了反向对齐,Cα模型等多种情况的MIACN算法外,我们的算法能够更好地寻找蛋白质结构之间的序列无关相似性。此外,相对于基于定长AFP的结构比对算法,我们的算法采用变长的AFP使得算法在执行效率上有了很大的提升。
其他文献
大肠杆菌O157:H7(Escherichia coli O157:H7)属于一种危害十分严重致病菌,而且从传播途径上来看,它属于食源性致病菌,极易造成人体感染,感染后的症状通常是引起腹痛腹泻、出
随着我国经济的快速增长和陆上石油资源的逐渐开发殆尽,越来越多的国家和地区正在面临着能源短缺的问题,与此同时海洋石油的开发逐渐进入到人们视野中。海洋石油的开采必然离
本文主要研究几类群的不确定性问题,将模糊集、粗糙集和软集应用到群中,讨论了群的性质和结构.进一步地,提出相应的决策算法,进而处理现实生活中的不确定性问题.全文共分为四
高分子电解质膜燃料电池近年来被人们广泛研究,作为绿色、便携式电子设备的能源装置,其潜力巨大。贵金属作为催化剂而导致的昂贵价格是阻碍质子交换膜燃料电池发展的主要原因
在互联网高度发展的今天,人们已经习惯了通过网络访问各种数据、处理各种事务。信息系统成为各行各业的基础设施,政府机关对信息系统的依赖也越来越强。政府信息的特殊性要求
随着移动终端之间信息共享的需求不断增加,对等通信(D2D:device-to-device)技术应运而生。然而,D2D技术利用的仍是有限的无线频谱资源,无法为用户提供更大带宽的服务。可见光
随着人们对建筑使用功能和审美要求的不断提高,以及轻质、高强的新型建筑材料在土木工程领域中的应用越来越广泛,现代建筑尤其是大型公共建筑如大型场馆、大型车站等,具有大
地震是人类所面临的最严重的自然灾害之一,有史以来地震所造成的生命财产损失不可计数、不胜枚举。目前工程方法模拟地震动场存在的主要问题就是很难合成功率谱和目标谱完全
伴随社会信息化的发展,人们面对的问题也愈复杂化和模糊化,决策属性也往往具有相互关联性,多属性群决策(MAGDM)方法的研究已成为管理科学领域的一个重要研究方向。针对属性值
无线通信因开放性而更易被攻击的特性,使得众多研究人员投入到无线通信安全的研究中。其中包括利用无线信道的短时互易性,空间变化性与时变性等理论基础的密钥生成机制。通过