【摘 要】
:
序列比对是生物信息学中重要的研究课题,是发现序列的功能,结构和进化信息的重要手段。现有的很多比对算法都是基于目标函数,目标函数利用替换矩阵和空位罚分对比对过程和结
论文部分内容阅读
序列比对是生物信息学中重要的研究课题,是发现序列的功能,结构和进化信息的重要手段。现有的很多比对算法都是基于目标函数,目标函数利用替换矩阵和空位罚分对比对过程和结果进行记分,用记分值来判断序列比对结果的好坏。基于目标函数的比对算法的缺点是记分系统的些许变动就可能导致局部或全局比对剧烈变化。由此,本文提出了DNA序列最大似然度比对算法来对DNA序列进行序列比对。本文首先介绍序列比对的基本概念,详细叙述了替换矩阵、空位罚分和目标函数以及它们对序列比对的影响,然后深入研究了双序列各种常用的比对算法:点阵分析、动态规划算法和词或k-串方法,并给出了它们的算法思想或伪代码。接着,根据基于目标函数算法的缺点,提出最大似然度比对算法,该算法分为两个部分:参数估值算法和比对算法。最大似然度比对算法首先使用进化参数估值算法对一对DNA序列相关的进化参数进行估值,然后比对算法利用估算出来的参数值对DNA序列进行比对。它是一个独立的方法,完全避开了基于替换矩阵和空位罚分的序列比对算法由于DNA序列相似度的不同而要选择与之相适应的替换矩阵的问题。最后,通过对进化模型最大似然度DNA比对算法的序列比对结果和FASTA比对程序结果进行比较,验证了进化模型最大似然度DNA比对算法的正确性和精确性。
其他文献
重复体识别是生物信息学中分析基因组序列的主要手段之一。在真核生物基因中重复体DNA占据了非常重要的地位。通过识别重复体可以发现基因组的进化规则和许多疾病的遗传规律
平标签网络体系架构是由美国加利佛尼亚大学伯克利分校的Matthew Caesar等人提出的一种全新的网络结构模型。该网络模型给出了一种新的网络标识结构的设计,力图从源头上杜绝
增强现实技术(Augmented Reality,AR)是随着虚拟现实技术(Virtual Reality,VR)的迅速发展和实际应用需要而出现的一种将真实世界信息和虚拟世界信息“无缝”集成的新技术,是一种
公钥密码技术是网络安全技术中一项非常关键的技术,它在密钥管理、数据加密以及数字签名与认证中起到不可替代的作用,基于MQ问题的多元多项式公钥密码体制(MPKC)由于其自身安
网格计算是近年来分布式计算在科学研究领域和商业领域的新的研究和发展趋势。网格计算系统的部署使企业的闲置计算资源得到充分利用,省却了企业在超级计算机上的投入,使得企业
计算机动画是把一系列静态图片有序排列形成连续的动态画面的过程,每一幅图片即是一帧。渲染是把三维几何模型转换为图片的过程,非常的耗时。网格技术的出现和发展,为其高效渲染
平台识别是目标识别的关键技术,针对平台识别具有不确定性和难于进行并行推理的特点,将模糊Petri网的形式化推理方法应用于平台识别,利用它的并行处理能力对平台识别进行高速处
语义网环境的诞生,为信息检索技术开辟了一条新的途径,它可以在知识理解和知识推理的基础上实现对信息资源的准确、全面的检索。用于在语义和知识层面上描述领域概念模型的本体
三值光计算机理论体系是一个很有前景的计算机发展思路。在这个理论体系中,采用光的两个偏振方向相互正交的线偏振态和无光态表达三值信息。本文介绍了国内外光计算机的发展过
可重用设计方法是以IP复用和IP设计为基础的一种有效的设计方法与先进的设计理念,它将传统的停留在板级设计层面的嵌入式系统硬件设计提升到基于可编程逻辑芯片上的系统级设计。可重用设计方法的引入大大缩短了基于可编程逻辑器件的嵌入式系统设计周期,更为科研院所将独创的算法模型迅速转化为IP核,加以推广应用和知识产权保护提供一个良好的途径,成为设计系统原型的首选方式。本文将可重用设计方法成功地应用到实际科研项