论文部分内容阅读
随着计算机技术的飞速发展,有限元计算方法以及基于该方法的ANSYS等软件正成为工程和科学研究不可或缺的电磁问题分析工具。采用有限元法分析电磁问题,均可以归结为求解稀疏线性方程组。因此,稀疏线性方程组的快速解法成为有限元计算的关键技术之一,也是计算电磁学中的热点问题。尽管计算机CPU峰值速度和内存存贮容量在不断的提高,但随着工程和科学研究规模增大、复杂程度增加以及对分析精度和速度要求的提高,计算机性能仍然不能满足大规模电磁计算的需要。因此,研究如何进一步减少存贮需求及提高计算效率具有重要的理论和实践价值。
本文构建了基于ANSYS的有限元模型及矢量有限元通用计算公式,针对该技术得到的稀疏线性方程组,在分析现有稀疏线性方程组求解技术的基础上,围绕如何减少存贮需求和提高计算效率的问题,拓展了多波前法、预条件技术以及基于预条件迭代求解的GPU加速技术,主要工作和创新点如下:
1.构建了基于ANSYS的有限元模型及矢量有限元通用计算公式,并分析了稀疏线性方程组求解技术。对基于ANSYS的有限元建模技术进行了研究,给出了多介质区域的模型建立方法,结果验证了该建模技术的可行性;针对闭域和部分开域问题分别推导了有限元基本公式,并给出通用计算表达式;针对基于通用计算公式得到的稀疏线性方程组,分析并讨论了稀疏线性方程组的直接求解方法及其关键技术,特别就稀疏矩阵的Cholesky分解法的几种执行方式的特征进行了对比和分析。
2.提出了有限元稀疏线性方程组的求解方法,并基于该方法提出了预条件技术,将其与迭代法结合进行求解,结果验证了所提方法的正确性和有效性。基于Cholesky分解方法提出了适用于复对称矩阵的拓展的Cholesky分解法,并将之与多波前法结合以用于对称问题的计算;针对非对称问题,采用基于LU分解的多波前法进行求解,并给出具体实施策略;基于对两种多波前方法的研究,论文提出了预条件技术以提高计算效率,并将其与迭代法结合求解有限元方程组。结果验证了所提方法的正确性和有效性。
3.提出了GPU的内存访问准则,并基于该准则,提出一种行排序和三种列排序GPU压缩存贮格式,通过性能比较表明提出的存贮格式能够快速有效地提高计算性能。在研究中,首先分析了GPU的内存模型,并基于不同内存模型的特性提出了相应的内存访问准则;进而,基于该准则研究了GPU计算采用的压缩存贮格式,将所有格式分为行排序和列排序两大类;随后,提出更高效率的MCTO行存贮格式,该格式能够合并同时访问同一内存的地址,从而满足内存访问准则;最后,提出sliced EET,sliced EEV-T and sliced EEV-F三种列存贮格式,三种格式均满足内存访问准则。性能比较表明提出的格式能够具有快速有效的计算性能。
4.针对本文提出的四种压缩存贮格式,提出了相应的GPU并行计算策略。基于对行排序并行策略的研究,提出了适合MCTO格式的并行计算方法,并分别给出该算法在加法、点乘和稀疏矩阵矢量乘中的具体实施策略;基于对列排序并行策略的研究,提出了适合sliced EET、sliced EEV-T以及sliced EEV-F格式的并行计算方法。基于两种压缩存贮格式的并行算法性能评估的结果表明,并行策略能得到更好的计算性能。