嵌入式环境下三线性分解算法优化技术研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:qiqi251305430
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三线性分解算法因能对复杂多组分体系中的各组分同时进行定量分析而在众多领域得到应用。然而在嵌入式环境下,该算法因平台优化不足而性能不佳。三线性分解算法计算复杂,如何优化嵌入式平台上三线性分解算法,提升算法性能成为亟待解决的问题。与桌面平台相比,现有的嵌入式平台在指令调度器和TLB (Translation Lookaside Buffer)等部件上有所简化。同时,传统的嵌入式优化多在资源受限的平台上进行,对现有资源丰富的嵌入式平台优化工作较少。本文为了解决三线性分解算法在现有嵌入式平台上性能较低的问题,针对平台特性对算法进行优化,缩短算法的计算时间,具体工作如下:在对三线性分解算法进行性能分析的基础上,研究了平台的体系结构特性,确定了算法优化的核心为矩阵乘法优化。计算出优化矩阵乘法后算法的最大加速比,以评估优化效果。针对ARMv7体系结构在指令调度器和TLB替换策略上与桌面平台的不同,优化GotoBLAS中的矩阵乘法分块算法,提升矩阵乘法的基础性能。在上一步优化的基础上,利用NEON核心的向量计算特性优化矩阵乘法核函数,利用NEON核心的数据访存带宽优势加速矩阵乘法中部分拷贝的访存过程,从计算和访存两方面共同优化矩阵乘法。为验证优化策略的有效性,本文首先实现了优化的矩阵乘法,并在基于ARMv7体系结构的各平台上进行性能评估,然后检验三线性分解算法在优化矩阵乘法后的加速比。实验结果表明,本文优化的矩阵乘法在性能上优于其他开源库,实现了7-30倍的加速比,从而使三线性分解算法整体性能提高了2.8倍,达到了较好的优化效果,具有一定的理论意义和应用价值。
其他文献
近年来,随着计算机相关技术及图形图像技术的广泛应用,医学图像的质量和显示方式得到了极大的改善,从而借助于图像处理与分析技术使得诊疗水平大大提高。医学图像的三维可视化是
负载均衡技术是并行文件系统中常见且不可或缺的重要优化手段。在并行文件系统中实现副本技术,利用负载分析方法和调度算法,可以有效地将系统中各种负载均衡地分配到各存储节点
随着互联网技术的发展和网络规模的扩大,人们对远程登录的需求也变得十分迫切,很多企业、组织对网络设备以及服务器的管理都需要使用远程登录服务。因此远程登录技术成为了非
随着科学技术的快速发展,越来越多的企业或单位开始利用虚拟机搭建数据中心来应对日益增长的计算需求。然而,随着数据中心虚拟机数目的不断增加,单个虚拟机发生故障从而导致整个
视觉物体表示(visual object representation)是联系底层图像信息和高层语义概念之间的纽带,在物体识别、图像检索等计算机视觉任务中起着关键性的作用。基于鲁棒性局部图像特
在现在的经济社会中,大量的商品和服务的支付都需要使用银行交易业务。银行系统在金融机构中的作用越来越重要,这直接关系到金融机构的盈利和为其客户提供便利服务。世界银行
随着互联网的发展,大数据时代悄无声息地走到了我们身旁,每天用户各种各样的行为产生了数以亿计的数据,这其中就包括了社交信息,购物信息以及浏览信息等。大量数据中包含着很
随着高速铁路的快速发展,高速移动通信网络成为高速铁路信息化建设的重要方向之一。高铁移动通信网主要分为铁路专网和用户开放式网络。本文根据特定的用户开放式高铁移动通
现在移动手机的使用已经在我们日常生活中广泛地传播,我们利用移动手机作为照相机,收音机,随身听以及浏览网络的工具。由于大部分的网页是为桌面计算机设计的,很难用小的屏幕设备
支持向量机是在统计学理论基础上发展起来的一种新型学习算法,已在机器学习、模式识别等领域取得了较好的应用效果,然而随着训练数据集规模的不断增大,支持向量机也表现出学习效