基于块结构不完全近似稀疏逆的GPU预条件算法

来源 :信阳师范学院 | 被引量 : 0次 | 上传用户:mengyan902
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何构造一个有效的预条件子,用于加速求解大规模稀疏线性系统的收敛一直都是数值计算领域的研究热点之一。随着线性系统规模的增大,使用不精确的预处理方法求解大规模稀疏线性系统也逐渐开始备受关注,使用该方法可以在时间与精确度之间进行权衡。近年来随着GPU的快速发展,基于GPU使用不精确的方法构造预条件子用于求解大规模稀疏线性系统已经取得了丰硕的成果。目前针对预条件子构造的研究均集中在标量矩阵,但在实际的工程应用中,如多物理场问题,系数矩阵往往是以块状矩阵的形式出现的,虽然块结构的线性系统的数值算法大多是由标量线性系统推导而来,但实现策略以及性能调优等方面仍然存在较大的差异。所以本文面向CPU+GPU的异构计算系统,对快速构造一个有效的块不完全近似稀疏逆的预条件算法进行讨论与研究,主要工作如下:(1)在不完全近似稀疏逆(Incomplete Sparse Approximate Inverses,ISAI)算法的基础上,提出一种块结构的不完全近似稀疏逆(Block Incomplete Sparse Approximate Inverses,Block-ISAI)预条件算法和在GPU加速平台上高效的实现策略。在预处理方面,为避免在预条件步骤中使用强数据依赖的backward-substitution和forward-substitution求解块三角线性系统,基于Block-ILU分解的预处理方法,使用Block-ISAI算法将预条件步骤转化为可高度并行的矩阵向量乘操作。在GPU实现方面,充分考虑了块矩阵的整体稀疏且局部稠密的特性,并结合GPU平台上融合访存和共享内存等优化技术,基于CUDA中基本调度单位warp,提出了一种以warp为单位来分配线程任务的策略,该策略能够保证每一个warp以块为单位并行计算上下三角因子的近似逆的每一列,从而充分发挥GPU细粒度高并发的计算特性。(2)在预处理步骤的求解效率方面和基于Krylov子空间方法的GMRES整体求解时间方面,将本文提出的Block-ISAI预条件算法与基于cu SPARSE的块三角线性求解的预条件算法,在由Intel E5-2640 V4@2.40 GHz处理器与NVIDIA的Tesla V100 GPU组成的异构计算平台上进行了详细的实验对比分析。在选取了来自Suite Sparse矩阵集合中几个典型的矩阵进行测试后,结果表明,虽然本文提出的Block-ISAI算法增加了迭代步数,但大大缩短了迭代中的预处理时间,总的求解时间比基于cu SPARSE预条件算法要少,加速比为1.19~6.69。
其他文献
随着我国公共医院管理事务的快速发展,中国政府部门对医药卫生事业的投入越来越多,其中如何使医院门诊管理科学性、细致化成为我国公共医疗管理亟待解决的重要问题。门诊部是公共医院工作流程中对外服务的重要窗口,门诊部的服务水平、就诊功效和质量直接关系到患者的健康和公共医院的声誉。在我国,当公办医院配备门诊部医生时,往往依靠经验排班管理及评估各级医生的工作,然后提出统一的排班计划,将医生的个人工作计划与公办医
学位
网络日益普及,视频已被广泛应用于传播信息,视频通信设备潜移默化地进入人们的生活中。然而,视频通信设备的存储和处理能力有限,难以容纳大量的视频数据,以及获取的视频资源有限,导致视频无法流畅播放,与此同时,由于网络信息技术发展迅速,当前视频的清晰度、流畅度已无法满足人们的视觉需求,因此,如何提高视频质量成为研究的重点。为了实时提供高质量视频,视频通信设备通常在传输视频时,先通过丢帧的方式降低视频帧率,
学位
随着现代无线通信技术在民用、国防等领域的广泛应用与高速发展,人们对整个无线电系统提出了更高的要求。天线和滤波器作为通信系统的关键元件,对系统的性能具有较大的影响。因此,研究用于微波毫米波段的低剖面、小型化、高集成度、高效率的天线和滤波器尤为重要。由于基片集成波导(Substrate Integrated Waveguide,SIW)具有尺寸小、低剖面、集成度高、质量轻等优势,所以常常被广泛应用于微
学位
声振耦合分析对高速机车、舰艇、航空等重大工程领域具有十分重要的意义。目前的研究大都把水和空气作为声场介质,但这两种介质的机械阻抗有较大的差别,也就造成了强弱耦合之分。忽略这种影响会导致分析精度低甚至是出现错误。针对这一问题,采用有限元法(FEM)进行水下壳结构振动响应分析,边界元法(BEM)进行结构振动声学分析;组合有限元法与边界元法构成耦合有限元-边界元方法进行水下薄壳结构声振强耦合分析。为了克
学位
过去2000年气候变化对理解人类世的气候变化有重要意义。青藏高原及周边地区作为“亚洲水塔”,为陆地生态系统提供了重要的水资源。深入研究青藏高原过去2000年气候变化的时空特征可为预测全球变暖背景下青藏高原水资源的变化趋势提供依据。过去十几年来,青藏高原晚全新世古气候重建工作取得了一系列研究进展。但是,青藏高原过去2000年气候变化特征还存在诸多争议和不确定性结论。因此,迫切需要对该时段青藏高原古气
学位
城市表土不仅是城市生态系统的重要组成部分,而且也是城市环境中污染物质的强大载体,对生态环境和居民健康产生着深远影响。本文以信阳市城区130个表土样品为研究对象,采用环境磁学、地球化学元素和色度等方法,首先分析城区表土磁性特征(磁性矿物的含量、类型及磁畴)和物质来源,其次分析表土中8种重金属元素(砷(As)、钴(Co)、铜(Cu)、铬(Cr)、铅(Pb)、镍(Ni)、锌(Zn)和钒(V))的浓度特征
学位
地震模拟振动台是一种非常重要的抗震研究试验设备,该设备的研发涉及了土木、电子、数控、机控、液压、机电、数电等多个领域。整个地震模拟振动台系统可分为物理系统与控制系统两部分,其中控制系统对整个系统的控制精度起着至关重要的作用。为进一步探索高性能地震模拟振动台控制方法,提高系统波形再现精度,本文以信阳师范学院地震模拟振动台系统为研究对象,以系统频响特性与波形复现精度为评判标准,在完成对地震模拟振动台系
学位
伴随着全球化、信息化社会的逐渐形成,我国的教育正在经历着一场深刻的变革。翻转课堂作为一种全新的教学模式,可以重新构建教与学两者的关系,满足新课程改革“以学生为中心”的要求。与此同时,信息技术与课程的相互融合为教学带来了全新的发展机遇,尤其是在新冠疫情的影响下,网络教学的便捷性更是体现的淋漓尽致。基于这样的时代背景,在初中美术“设计·应用”领域中进行翻转课堂教学,能够创新教学模式,提升学习效果,为国
学位
随着互联网技术的快速发展,网络传媒以其化繁为简、化抽象为具体的功能给语文课堂教学改革注入了新的活力,成为了传统语文教学方式的强大辅助工具。其为教师提供了新思路、新思想,也为初中生在语文写作、阅读、综合性学习方面提供了新的学习方法,对培养学生的创新思维与综合素养具有积极作用。但其复杂性、不可控性也造成一些消极影响。因此,如何利用新型网络传媒技术教学优势,实现与传统语文教学方式深度融合与发展,成为本文
学位
近年来,信息技术在教育领域得到了快速发展,随着无线网络的普及,电子产品的不断升级,微课以其短小精悍、地点灵活、丰富有趣等特征得到一线教师和学生的喜爱,迅速成为一种新型教学资源,在实际教学中进行应用。尽管广大教育工作者对微课的研究越来越多,但大多是对微课的理论研究,微课的应用还是存在一些问题,比如:网上微课质量良莠不齐,微课的设计太片面,没有系统性等等。目前并没有深度开发微课与初中物理电学教学的融合
学位