大规模稀疏线性系统的并行求解方法研究

来源 :华北电力大学 | 被引量 : 0次 | 上传用户:lqw1100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,大规模稀疏线性系统的求解是许多科学计算和工程技术的重要组成部分。在一些以直接法为基础的稀疏线性系统求解任务中,稀疏线性三角系统的计算是求解大规模稀疏线性系统的核心环节。因此,快速求解稀疏线性三角系统成为了解决整个科学计算问题的关键。近几年,随着科学计算任务的规模和复杂度不断提高,稀疏线性三角系统的规模和复杂度也越来越大,导致所需处理的数据量骤增。然而,已有的求解方法均受限于稀疏线性三角系统求解的传统观点,即某一个变量的求解必须等到其所有前驱变量求解完成之后才能开始。这种方式不仅限制了求解时能够达到的任务并行度,无法充分利用众核处理器丰富的并行硬件资源。而且,线程间频繁的数据传递使同步开销较大,甚至抵消了并行计算技术带来的优势。针对现有方法存在的问题,本文提出一种基于部分值相加的并行求解算法。该方法首先并行计算变量的部分值,然后把变量的所有部分值相加得到变量的最终值。由于变量计算时无需等待所有前驱变量完成计算,大大提高了求解并行度和计算速度。在本文工作中,基于CUDA计算平台实现了并行求解算法。该算法把表示变量求解顺序的关联图分解成多个子图,每个线程计算子图的一层,充分利用了GPU丰富的并行计算资源。其次,为了减少存储器访问对算法性能的影响,充分利用了全局内存容量大及共享内存访存延迟低的特点,对本文提出的并行求解算法进行了优化。实验结果表明,与调用cuSPARSE库的求解算法以及无同步并行求解算法的计算时间比较,本文并行算法的计算速度平均提高80%,最大提高99%。在保证计算精度的前提下,大大提高了稀疏线性三角系统的求解速度。
其他文献
编者按:阿根廷瓷砖反倾销案自2013年终裁之后,因为高额的反倾销税征收,我出口瓷砖至阿根廷已经大幅度下降。该案原本在2018年才到期,2017年底会提起日落复审,但是阿根廷生产部突然在今年11月提起了一个复审调查,让业内人士感到十分奇怪,不知用意何为?  有业内人士建议有关企业不必特别关注本次复审,还是要为明年的反倾销日落复审做好申诉准备。  1 案件回顾  2012年7月27日,阿根廷对华瓷砖反
本文从艺术图式的角度分析文革时期石湾人物陶塑的图示语言和形象意义,分析文革时期石湾人物陶塑创作,在既服从于政治意识形态,又相应衍生出与之配套的技术语言时,完成对旧有艺术
利用稀土直接掺杂工艺合成了一种“常光充能”型电子陷获材料CaS∶Eu,Sm,它不仅具有CaS∶Eu无机发光材料的荧光光谱特性,而且具有红外升频转换特性,可将0.8~1.6μm的红外光直接转