改进的基于分步的复合模式查找算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:huangxiaojuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复合模式查找是生物信息学中模式发现问题的一个新的研究领域,而寻求效率更高,精度更高的复合模式查找算法将是此研究领域的热点与目标。复合模式查找问题是模式查找问题的泛化形式,而复合模式查找的难点在于组成复合模式的其中一个或多个单分体模式可能“太弱”,即不具有统计显著性,因此通常用于查找单分体模式的方法很难应用于复合模式查找。本文提出一种改进的基于分步的复合模式查找算法,称为IACF算法(theImproved Algorithm for Composite Pattern Discovery based on Fractional Steps),IACF算法将随机投影算法、遗传算法和多序列比对算法结合在一起:首先使用随机投影算法和遗传算法查找复合模式中强单分体的模式实例;再在其下游或上游一定距离范围内定位出另一个弱单分体的候选模式实例,用多序列比对找到每条序列的弱的单分体的模式实例,并记录两个单分体模式实例间的距离,组合两部分得到复合模式实例;最后用不考虑空位和碱基相关性的共有序列表示法得出复合模式。IACF算法只需要查找复合模式中较强部分的单分体模式,且整个过程只需要进行一次查找。通过实验表明,IACF算法对于模拟数据和真实数据都有其实用性,与RISO、MITRA-Dyad、ECOMP算法相比,IACF算法内存占用较少,且在复合模式中存在一个较强单分体模式的情况下,查找时间少于其它三种算法。
其他文献
随着3G网络在中国的普及,手机已经成为人们日常生活中必不可少的通信工具,在人们利用手机短信进行沟通的同时,社会上垃圾短信的泛滥对广大手机用户造成了极大的不便,同时也带来了
随着网络的迅速发展,信息的安全保护问题日益突出。信息隐藏技术作为隐蔽通信和版权保护的有效手段迅速成为信息安全领域的研究热点。文本数据由于自身的特殊性,占据着人们生活
随着信息技术的不断发展,人们所要面对的信息量与日俱增,如何快速处理如此庞大的信息量已成为人们所要考虑的重要问题之一。图像信息在整体信息中所占的比重也在日趋增加,实现图
矿井环境监控系统是无线传感器网络典型应用的一种。井下无线传感器网络要求路由协议能够均衡网络节点能耗、提高网络通信的可靠性、适应网络结构的变化以及延长网络生存期等
近年来,复杂网络逐渐成为描述与分析现实复杂系统的重要工具而备受关注。复杂网络的大规模性、强耦合性、局部性等特点促使研究人员通过局部特性来刻画与研究整体特性。其中,社
本文旨在提高有限域上椭圆曲线算术运算的效率,主要研究了二进制扩域上的平方运算、有限域上的求逆运算以及椭圆曲线上的标量乘运算,并针对三种不同的运算分别提出了一种快速
随着计算机科学及彩色输入/输出技术的发展,人们对于色彩再现的质量提出了更高的要求。研究发现,当图像在跨设备复制时经常出现颜色不匹配的现象,在色彩管理系统中加入色外观
近年来,智能卡在很多领域被广泛应用,Java卡作为一种高端智能卡,具有一卡多应用和高安全性等优势,并且其上的应用程序理论上在所有的Java卡上都可运行,便于不同厂商的产品在同一个
社会网络是在人类学,心理学,社会学,图论等理论的基础上发展起来的一门科学,至今已经有70多年的历史了。计算机网络经过了半个世纪的发展,现在已经有了长足的进展,各种网络应用层出
序列比对是生物信息学中一种基本的信息处理问题,对于发现核酸和蛋白质序列上的功能、结构以及进化信息具有非常重要的意义。随着生物序列数据库中序列数据的激增,设计出能够处