基于MPI和CUDA的蛋白质定量软件的设计和分析

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:csnzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文介绍了蛋白质定量软件的设计及测试结果.分析结果表明:P-QuantWiz软件在曙光6000的Intel集群部分,测试规模达到2048核,在256核加速比仍在增加.相对P-QuantWiz软件在单CPU运行的结果,PG-QuantWiz软件在单GPU运行的加速比为8.1.PG-QuantWiz软件在16个GPU运行结果相对在单个GPU运行结果,加速比为14.18,效率为89%.
其他文献
索引表求交是搜索引擎中一个重要的操作,先前的研完工作主要集中在单核心或者多核心的CPU上。这篇文章提出了一种新颖的利用Bloom Filter的近似索引表求交算法。尽管Bloom Filter会返回误称结果,发现错误的结果数相对求交结果非常少,并不会影响结果质量。本文的方法是基于一种批次的GPU处理框架,在这种框架中,查询在CPU端组织成为一个批次,并在GPU端进行处理,这个框架有效地利用了GPU
本文针对现有安全研究对虚拟机监控器层次的研究相对较少,尤其针对现有的漏洞检测研究中缺乏对KVM(Kernel-based Virtual Machine)的虚拟机环境及其漏洞监测的系统性方法的问题,提出了一种KVM虚拟环境检查和漏洞扫描方法。功能和性能测试验证了本文所提出方法的有效性。
本文结合曙光6000全局集合通信芯片的结构特点与测试需求,为该芯片制定出了一套完整的可测试性设计(DFT)方案,包括普通扫描、实速扫描、存储器内建自测试(MBIST)、边界扫描、测试压缩等。随着DFT的引入,如何为各工作模式提供需要的时钟,并实现多模式在多工艺角(corner)下的时序收敛成为我们面临的一大挑战。本文专门设计了一个片上时钟控制(OCC)模块,并为方便时序收敛做了提前的考虑与设计。除
MAGMA是第一个面向下一代体系架构(多核CPU和GPU)开源的线性代数软件包,它采用了诸多针对异构平台的优化方法,包括了混合同步,通信避免和动态任务调度系统.它在功能,数据存储,接口上与LAPACK相似,可以发挥GPU的巨大计算能力进行数值计算.本文首先对MAGMA中的矩阵分解算法进行分析;然后通过测试结果,分析 MAGMA有效的优化和并行方法,为 MAGMA使用、优化提供有益的建议;最后本文提
网络流量的不断增长和网络攻击形式的多样性,使得网络入侵检测系统(NIDS)变得越来越复杂。基于单引擎检测的NIDS 靠辅助硬件和改进检测算法来提高处理性能,已无法适用10G 以上流量的线速处理要求。利用多检测引擎进行并行处理是实现高性能入侵检测的重要技术手段,并行检测系统通过多检测引擎进行并行协同检测,具有高性能和可扩展的优点。综合现有并行入侵检测框架的优点,提出了一个统一的支持多检测引擎并行检测
基于本体的案例检索系统中,由于数据库中的案例数量随着时间的推移而成倍增加,案例检索的效率不断降低。本文提出了一种多维案例检索算法DRR,该算法通过将多维空间案例点降维成二维空间点,利用一个二维空间点来代表类案例点组成的集合,并对此二维空间点建立R树空间索引,通过两级检索的方法,加速了检索效率和准确率。实验证明该方法不仅提高案例检索的准确率,还极大地提高案例检索的效率。
本文提出了基于词共现和语义分析的网络百科开放分类聚类算法、开放分类层次结构树生成方法以及层次结构树聚类算法。实验结果表明,开放分类层次结构树的准确率较高,利用开放分类层次结构树检索百科条目的查全率较高,说明了该方法的可行性和有效性。
当前在高性能计算机平台上,大规模、大尺度、长时程数值计算由于浮点计算的舍入误差累积效应,常导致不可信的数值结果。与此同时,多项式函数广泛应用于大规模工程科学计算的各个领域,快速可靠计算多项式函数值在高性能计算中显得尤为必要。本文运用无误差变换理论,从浮点运算代码层面上,分析舍入误差累积效应及其在计算多项式函数值算法中的代数结构和统计特性,进而设计误差可控的补偿数值算法。以此为基础构建了计算单变量和
整型数据排序是一种重要的数据排序问题。提出一个多核异构机群上数据分配模型,使得数据的分配调度能够适应各节点不同的计算能力、通信速率和存储容量,以平衡各个节点的负载;利用整数序列的特性,主节点采取两轮数据分发与接收结果的方法,从节点运用分桶打包方式返回有序整数子序列给主节点,主节点采用桶映射方法将各个有序子序列直接整合成最终有序序列,免去了通信量较大的数据归并操作,实现并行排序过程的通信高效。实验测
我们完成了一个基于GPU集群的离散单元法计算平台原型。该软件平台在颗粒自由堆积模拟和CFD-DEM耦合模拟气固流化中得到应用和验证,GPU发挥了突出的计算性能并且具备良好的可扩展性。