高效高精度浮点求和方法的实现与比较

来源 :东北师范大学 | 被引量 : 0次 | 上传用户：qhxfxfxf

【摘要】

：

【作者】

：

赵微

【机构】

：

东北师范大学

【出处】

：

东北师范大学

【发表日期】

：

2021年01期

【关键词】

：

浮点求和无误差变换舍入误差高精度求和算法并行实现

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自从有了电子计算机,浮点数求和的方法和精度就是计算机和计算数学界关注的基本问题之一。由于数据在计算机上的存储、运算可能会产生舍入、有效位相消、大数“吃”小数等问题,大规模浮点数求和时可能会有误差累积,甚至出现上（下）溢现象,使得求和结果完全失真。因此,高效可靠的浮点求和算法是计算数学和计算机科学的关键任务,本文也关注高效高精度浮点求和问题。在介绍了一些一般求和方法之后,本文首先综述了文献中已有的一些高精度求和算法,包括补偿、双补偿、SumK、AccSum和FastAccSum算法,给出了各算法的理论误差界,并对各算法的优缺点进行了比较。其次,在相同计算规模下,对各种算法利用MATLAB进行了串行实现,比较它们的运行时间和可达到的精度,发现双补偿算法和FastAccSum算法更高效,精度更高。再次,本文利用MPI+C语言实现了已有的一些并行求和算法,且创新性地对双补偿算法和FastAccSum算法进行了并行实现,将这些算法在国产曙光并行机上进行了并行的数值实验,在处理机个数、问题规模、数据病态程度上比较了各种并行算法,得到了相应的高效高精度并行求和算法的比较结果。最后,从数值实验结果来看,我们发现无论以串行还是并行实现,FastAccSum算法在计算时间和精度上都表现出非常好的性能。因此,我们推荐使用FastAccSum算法进行浮点求和。

其他文献

基于ODE方法的非凸随机QHM算法的收敛性

最优化问题是计算数学中最为重要的研究方向之一。而在深度学习领域,优化算法的选择也是一个模型的重中之重。即使在数据集和模型架构完全相同的情况下,采用不同的优化算法,也很可能导致截然不同的训练效果。随机梯度下降算法（SGD）在神经网络模型训练中是一种很常见的优化算法,然而,SGD算法的高方差振荡使得网络很难稳定收敛。拟双曲动量算法（QHM）是基于动量的SGD的一种简单的变换,其更新可以看作动量项与SG

学位

随机梯度下降拟双曲动量常微分方程收敛性

一类具有非线性跳跃条件抛物型界面问题的优化施瓦兹方法

针对一类描述化学传感器中离子浓度的具有非线性跳跃条件的抛物型界面问题,本文提出多种优化施瓦兹（波形松弛）方法计算方案.这是一种时空整体求解方案,将求解区域（1,1）×(0,T]分解为（1,0）×(0,T]和（0,1）×(0,T],并将整体异性介质问题转化为子区域上的单一介质问题的组合进行迭代求解.本文通过设计界面上的传输条件,实现以下两个目的:1.将整体非线性问题转化为线性子问题求解;2.区域分解

学位

抛物型界面问题非线性跳跃界面条件优化施瓦兹方法参数优化

二维不完备列联表拟独立模型的Markov基

在用列联表描述分类变量之间的关系时,结构零作为数据的一种特性或数据结构的一种推论,致使不完备列联表在很多实际问题中重复出现.对不完备列联表拟独立模型进行精确检验时,Monte Carlo方法作为有效估计p-值的一种方法,计算Markov基尤为重要.本文从代数角度和Markov基的结构两个方面讨论求解Markov基的方法,我们利用Markov基的结构对Markov基中冗余移动进行约简,特别的,当mi

学位

结构零列联表拟独立模型Grobner基Markov基环形移动

各向异性扩散问题若干Q1有限体积元格式的强制性分析

本文主要研究各向异性扩散问题三种Q1有限体积元格式的强制性,分别为基于梯形公式的Q1有限体积元格式,基于中点公式的Q1有限体积元格式和基于辛普森公式的Q1有限体积元格式。针对基于梯形公式的Q1有限体积元格式,采用了两种方式分析其强制性。第一种分析方式是通过单元刚度矩阵合同于一个3×3矩阵得到了这个矩阵正定的一个充要条件,进而得到确保这个格式强制性的一个充分条件。第二种分析方式是根据格式的单元双线性

学位

Q<sub>1</sub>有限体积元格式强制性梯形公式中点公式辛普森公式

非凸随机设定下两类RMSProp算法的收敛性

近年来,得益于计算机编程语言,显卡并行处理以及多线程处理机制等功能的快速发展,深度学习技术的有效性得到了大量的实验论证.深度学习在我们的生活中应用十分广泛,例如语音识别,计算机视觉和自然语言处理等.对于一个确定的深度学习任务,优化算法是否有效将是深度学习结果好坏的决定性因素.目前,自适应梯度算法是最受欢迎的一类优化算法,其中最具代表的有AdaGrad,RMSProp和Adam.在实际实验中,当网络

学位

非凸随机优化全局收敛性RMSProp算法自适应梯度算法

高精度MQ拟插值算子的构造及其在偏微分方程中的应用

在本文中,我们基于王自强给出的拟插值算子LR,构造了一个全新的高逼近精度的Multi-Quadric（MQ）拟插值算子Lw1.第一部分为引言部分.介绍了径向基函数产生的背景和MQ拟插值的研究现状,同时还阐述了 MQ拟插值在偏微分方程中的应用并概述了本文的主要工作.第二部分是预备知识部分.介绍了径向基函数和MQ函数及其相应插值的相关知识.同时还引入了两种已改进的拟插值算子,一种是王自强提出的拟插值算

学位

MQ拟插值算子Burgers方程DP方程Newell-whitehead方程

广义弹性传输特征函数的局部几何性质及其应用

在本篇硕士论文,我们考虑满足Lame系统的入射场ui以及有界散射体Ω,下面非线性且完全连续的散射映射#12将一个非均匀弹性散射体（Ω;γ,μ,V）映射到它的远场模式（?）。这里（λ,μ,V）表示在Ω中紧支撑的弹性散射体的介质配置。在本篇硕士论文,我们研究了S核空间的内部几何结构,它对弹性波的反散射和隐身理论具有重要意义,并且近年来受到了广泛的关注。本篇硕士论文的研究是在分析一类非自伴非椭圆传输特征

学位

弹性非散射和隐性传输特征函数几何结构角点奇异性反障碍问题唯一可辨识性单个远场模式

具有无限时滞的随机泛函微分方程在分布意义下周期解的存在性

近年来,随着随机微分方程理论的不断发展,时滞现象受到广泛关注.同时,对周期解问题的研究一直是微分动力系统领域的中心课题.本文将研究如下具有无限时滞的随机泛函微分方程在分布意义下周期解的存在性.dX（t）=f（t,Xt）dt+g（t,Xt）dW（t）.首先,由于时滞是无限的,本文选取了一个恰当的范数,并据此定义了一个合适的相空间.在此空间下,参考确定型微分方程中的Halanay准则,构造出了适用于具

学位

随机泛函微分方程无限时滞周期解大数定律

三角形网格上扩散问题的二次有限体积元格式的强制性分析

本文研究了三角网格上扩散问题的一类二次有限体积元（FVEM）格式的强制性,这类格式涵盖了现有的拉格朗日型二次格式。利用从试探函数空间到检验函数空间的一般映射（ω=1）,我们发现每个单元矩阵可以分解为三部分:第一部分是标准二次有限元法（FEM）的单元刚度矩阵,第二部分是FVEM与FEM在单元边界上的差,而第三部分为两个向量的张量积。利用此分解,我们得到了保证三角形网格上FVEM解的存在唯一性和强制性

学位

扩散问题二次有限体积格式三角单元强制性最小角条件最优H<sup>1</sup>误差估计

g-期望下的线性二次随机微分对策

本文主要研究g-期望下的二人零和线性二次随机微分对策问题.对此问题,我们引进开环鞍点和闭环鞍点.在开环鞍点方面,我们利用正倒向随机微分方程,得到开环鞍点的平稳性条件.在闭环鞍点方面,我们利用Riccati方程,对闭环鞍点进行刻画.

学位

正倒向随机微分方程g-期望线性二次随机微分对策平稳性条件Riccati方程开环鞍点闭环鞍点

高效高精度浮点求和方法的实现与比较

与本文相关的学术论文