【摘 要】
:
稀疏矩阵向量乘(SpMV)(y=A*x)广泛用于科学计算和工程计算中,如大规模线性代数系统的求解,粒子输运模拟,流体动力学偏微分方程的求解,天体物理学和偏微分问题等。它被归类为
论文部分内容阅读
稀疏矩阵向量乘(SpMV)(y=A*x)广泛用于科学计算和工程计算中,如大规模线性代数系统的求解,粒子输运模拟,流体动力学偏微分方程的求解,天体物理学和偏微分问题等。它被归类为“七个小矮人”的成员,即被认为在下一个十年最重要的数值方法之一。因此对于稀疏矩阵向量乘(SpMV)及其优化技术的研究有助于提升解决相关领域问题的运算效率,有着巨大的研究价值与意义。由于稀疏矩阵含有大量零元素,这直接导致SpMV访存的不规则性和差的浮点性能。SpMV访存的不规则性不仅使得计算平台在进行稀疏矩阵向量乘运算时很难充分使用向量单元进行加速,并且还会增加Cache未命中次数。由于稀疏矩阵自身的特点,使得稀疏矩阵向量乘运算的实现对稀疏矩阵的存储格式依赖十分严重。针对目前主流的稀疏矩阵存储格式CSR,本文提出了新的适合向量化的稀疏矩阵存储格式CSR(r),CSR(r,l1,l2),BCSR(r,l1,l2)。本文的主要工作总结如下:(1)查阅并研究国内外现有优化技术,从面向计算体系结构的优化方面入手,论述、总结并归纳了在该方向上现有优化技术的优势与不足,从而为本文的研究提供了基本的研究方向。(2)对目前主流存储格式CSR进行改进,提出了新的适合向量化的稀疏矩阵存储格式CSR(r),CSR(r,l1,l2)。与传统格式CSR相比,CSR(r)、CSR(r,l1,l2)的性能分别提高了45%,49%。(3)将CSR(r,l1,l2)向量化存储格式与块存储格式相结合,提出二维的稀疏矩阵存储格式BCSR(r,l1,l2)。与传统格式CSR相比,BCSR(r,l1,l2)的性能提高了66%。(4)对本文的上述方面研究作了总结性的概括,给出了本课题今后的研究方向,展望并提出下一步工作。
其他文献
系统辨识是流程工业领域一个重要研究分支,受到国内外专家及学者的高度关注。辨识方法的有效性将直接影响系统模型精度,进而影响模型的应用效果。在真实流程工业环境下,通常
将政府购买这一形式引入到公共服务生产和提供过程中是对人民群众对公共体育服务的需求多元化的一项制度回应。通过政府购买模式促进了我国公共体育服务的供给效率,优化了体
背景:肝细胞肝癌是一种我国常见的恶性肿瘤,在我国肝癌的发病率高居第四位,死亡率高居第二位。肝癌患者多起病隐匿,绝大部分就诊时已处于中晚期,错过手术治疗最佳时机,单纯依
司法裁判的可接受性承载了法律的社会效果和司法公信力,同时也关乎我国社会主义法治国家的实现和社会稳定和谐的维护,裁判的可接受性问题也作为我国司法裁判领域应有的一项重
课堂管理对于初中数学的教学效果有着直接的影响,有效的课堂管理可以为学生营造良好的学习环境,为教师推进数学教学活动提供保障,从而促使初中数学教学质量的大幅提升,也能够
信赖保护原则是指在行政过程中,社会成员基于对于公权力的信任而对某些行政因素或某种行政行为的存在产生的合理信赖,行政主体不得随意对社会成员所信赖的这种行政行为或行政
超密集组网技术作为第五代(5G)移动通信的关键技术之一,通过部署大量低功耗节点,缩短了接入点和用户设备(UE)之间的距离。相比于传统的单一宏基站部署,超密集组网不仅可以提升系统吞吐量,提高本地基站的频谱效率(SE)和能量效率(EE),还可以为网络提供小区分裂增益,解决网络的覆盖盲区问题,实现用户随时随地地接入。但是,超密集组网接入点密度的增大以及多种类型接入点的无规划部署使得干扰环境更加复杂,阻碍
量子密码的概念是1984年Bennett等人提出的,它是基于经典密码学和量子力学,利用量子力学原理实现无条件安全信息交换的一种新型密码体制.量子秘密共享是量子密码学中一个非常
近年来,法官人才的流失问题,成为了依法治国和推进司法改革进程中的拦路石。在高饱和的工作量下,面对同行业高薪高职的诱惑,没有谁可以安然不动。面对唾手可得的富贵,良禽择
单频光纤激光器由于其具有线宽窄、噪声低、光学信噪比高、单纵模运转且波长稳定性好等优点使得其在相干光束合成、高精度光谱学、光纤传感、激光雷达等领域有着巨大的应用价