Smith&Waterman算法在脉动阵列上的实现及分析

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:shawn200904
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是在数学、计算机科学和生命科学的基础上形成的一门新型交叉学科,是指为理解各种数据的生物学意义,运用数学、计算机科学与生物学手段进行生物信息的收集、加工、储存、传播、分析与解析的科学。序列相似性是生物信息学处理中的最基本的问题。如何获得结果更准确,时间和空间效率更高的序列相似性比较算法是生物信息学研究中的一个重要课题。序列比对就是通过一定的算法对两个或多个序列进行比较,找出序列间最大的相似性匹配。Smith&Waterman算法是一种经典的序列比对算法,在双序列比较的情况下具有比较好的速度和结果,但是在进行序列数据库搜索时则显得处理速度不足。论文主要讨论了Smith&Waterman算法以及在脉动式阵列上的加速。通过对Smith&Waterman比对算法的并行化方法的考察,引出细粒度并行化方法和定制硬件,特别是脉动式阵列;通过对脉动式阵列的结构和特点的分析,结合龙芯I号处理器的结构,设计了龙芯I号新的协处理器CP2为一个脉动式阵列,并设计了相关的一组指令集;通过对龙芯I号的模拟器的修改,实现了该协处理器和指令集;在算法和系统结构互相制约的基础上,描述了算法在脉动式阵列上的实现,明确了算法实现过程中的一些实现细节;最后通过在新的模拟器和原模拟器上的性能比较,针对实验数据中体现的协处理器的优势和不足,总结了脉动式阵列结构在各个方面对算法性能提高的影响,最后总结了已完成的实验内容以及未来工作的一些方向。
其他文献
集群以其优秀的性价比在高性能计算和超级服务器方面获得了广泛应用,但通信开销一致是制约集群性能进一步提高的关键因素,现已成为了该领略主要研究方向。发展日趋成熟的用户级
KDD是当前数据库研究中的一个热点,概念格则是知识发现和数据分析的有力的数学工具。本文主要关注的是基于扩展概念格的数据挖掘研究,其中内容主要涉及扩展概念格的完全构造以
XML(Extensible Markup Language)是一种基于内容描述的、结构规范的、能够体现数据信息之间逻辑关系和确保文件易读性的元标记语言.XML具有内容描述和显示样式分开、自定义
大数据计算应用具有软件栈系统多样和复杂(例如Hadoop,Spark,Storm等)、负载行为多样和配置参数繁多等特点,这些特点决定了大数据计算负载的调优具有以下挑战:1)性能瓶颈和优化方
该文主要在以下两个方面进行了深入的研究:一是软件测试理论与方法;二是软件测试充分性的度量.论文综述了国内外软件测试发展动态,介绍了软件质量的度量、白盒测试、黑盒测试
该文在讨论分析了目前移动设备的硬件能力和移动计算的主要技术后,采用了其中的一种技术——Java技术来实现一个较为完整的企业应用模型,并对该模型进行了分析和评价.文章着
软件配置管理是软件开发中的一项基本支持活动,是卡内基梅隆大学软件工程研究所SEI提出的软件能力成熟度模型CMM第二级的一个关键过程域.软件配置管理的目标是在软件生命周期
临床决策支持系统作为人工智能和医学知识工程研究中一个非常活跃的分支,一直以来都是国内外研究与应用比较热门的领域,其主要是指将患者的临床数据作为系统的输入信息,通过一系
传统的防火墙技术是采用的静态包过滤检查机制,静态包过滤机制的最明显的缺陷是:过滤检查的效率低;为期望的通信,它必须保持一些端口的永久开放,这就为潜在的攻击提供了机会,因此存
IP视频电话是一项飞速发展的业务,它通过IP网络来传送语音和视频信号。与传统的PSTN网络相比,IP网络具有以下两个特点:一是IP网采用尽力传送的策略,无法保证服务质量;二是IP