基于CPU-GPU协同计算的Krylov子空间算法研究与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:woshirenaaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科学计算与工程领域中,将计算问题离散之后,往往会得到大型稀疏线性方程组。线性方程组的求解占用了整个问题计算的很大部分时间,在油藏模拟中这一比例高达80%。因此快速高效地求解大型稀疏线性方程组成为了整个问题求解的关键。Krylov子空间算法作为一种经典的迭代算法,具有容易并行且存储开销小等特点,一直以来都是用来求解稀疏线性方程组的重要方法。   Orthodir(m)算法是众多Krylov子空间算法中的一种。该算法每一次迭代步中需要进行两次向量内积计算,且这两个向量内积具有数据相关性。在分布式存储并行计算机上,向量内积计算需要全局通信,成为了快速高效求解的瓶颈。本文受文献[45]中算法设计方法的启示,提出了一种改进的Orthodir(m)算法(IOrthodir(m)算法)。IOrthodir(m)算法在保证算法正确性的条件下,通过改变原有算法的计算次序,将两个分离的向量内积变为几个连续的向量内积,全局同步化点由两个降低为一个,较明显地减少了并行算法的全局通信开销。理论分析表明改进算法的扩展性优于原算法。当处理器数目满足一定要求时,改进算法计算速快于原算法。在16台曙光天阔集群上进行的数值试验表明,IOrthodir(m)算法计算性能优于Orthodir(m)算法。基于MPI和OpenMP混合编程模型对两个算法进行了编程实现,实验数据表明,在不同多核平台下,IOrthodir(m)算法性能同样优于Orthodir(m)算法。   针对改进算法中的矩阵向量乘积和向量内积的计算时间问题,提出了一种CPU-GPU协同计算策略,进行了计算任务优化分配,采用CPU-GPU异构平台协同求解问题的实验表明:相对CPU计算平台,GPU-CPU异构模式能够更好地提高计算效率。
其他文献
随着互联网以及建立在互联网上的各种新业务的飞速发展,互联网的用户规模不断扩大。由此,IPv4已经不能完全满足互联网的发展要求,并且暴露出了明显的局限性,其中最大的缺陷就是IP
当今互联网信息技术高速发展,传统TCP/IP体系结构开始面对可扩展性、动态性和安全可控性等难题的挑战。由此引发了未来互联网的研究热潮,研究者开始设计未来互联网的体系架构、
在无线传感器网络中,节点是电池供电,能量有限,而且当能量耗尽时没有外界补充。因此,能量对节点来说是最宝贵的资源,若不合理利用则会影响整个网络的生命周期。路由协议作为无线传
全球导航卫星系统(Global Navigation Satellite System,GNSS)不仅为用户提供了导航、定位和精确授时信息,还提供了高稳定的电磁辐射信号。基于GNSS的微波遥感(GNSS-Reflections或
在这互联网技术高速发展的21世纪,网络中产生的流量明显剧增,随着用户交互信息越来越多、共享文件越来越大,P2P这种参与节点既是服务器又是客户端的应用模式因其快捷可靠的网络
随着传感、通信、计算等相关技术的迅速发展,现代遥感技术能够准确、动态地提供多种对地观测数据,可获取的遥感影像呈现指数级增长。丰富的遥感影像数据为规划利用、环境监测、
车间作业调度(Job-Shop Scheduling Problem)是一个具有代表性的NP-hard问题,可是到目前来看,还没有一种最准确的方法能够表示出来。车间作业调度的NP-hard问题是生产中的核心
随着数字图像处理与计算机视觉的发展,数字图像处理技术已被广泛应用到各个领域。其中,数字图像处理与医学的结合已越来越受到重视。斜视检测技术是一种通过处理和分析用户眼球
随着Android手机的普及,人们对Android手机游戏的需求量越来越大。由于玩家对手机游戏品质的要求越来越高,游戏画质的精美程度已经不再是判断一款游戏好坏的唯一标准,游戏中的人
数学表达式中包含数字、运算符、字母等多种符号,加之结构复杂多样,为实现其索引与检索带来传统全文检索技术所不曾有过的困难。本文通过对数学表达式中符号间相互关系的分析