Backprojection成像多核并行计算系统设计

来源 :南京大学 | 被引量 : 0次 | 上传用户:tshanyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Backprojection雷达成像算法运算量极大,对成像系统的性能提出了极高的要求。本文在分析算法特征的基础上充分利用多种并行计算技术设计了一款高性能Backprojection雷达成像系统,提出并实现了多种提高性能的关键技术。针对算法的脉冲预处理部分包含大量的大点数复数向量运算和大点数FFT运算的特点,设计了一种直接支持FFT加速指令的SIMD向量处理器。出于性能的考虑,FFT在以往的系统设计中都是通过硬件加速器完成,而该SIMD向量处理器不仅能高效地完成算法的脉冲预处理部分所有大点数向量运算,还直接支持FFT加速指令,而且该FFT加速指令能提供和专用硬件加速器相同的FFT加速效率,因此避免了在系统中再增加硬件加速器所带来的额外硬件开销。针对算法反投影运算部分对性能要求极高的特点,设计了反投影加速器,其功能是把经过预处理之后的脉冲数据反投影到图像上的每一个像素点,性能达到每个时钟周期完成对一个像素点的反投影。在充分的误差分析的基础上,通过使用合理设计的定点表示代替双精度浮点表示,不仅使逻辑资源的开销降低了约50%,片上存储器资源的开销降低了37.5%,而且还提高了运算精度,相位的最大误差由11°缩小到了1.4°由于成像算法的反投影部分运算量之大以至于一个反投影加速器远不能满足系统性能要求,本文通过把多个反投影加速器集成为一个反投影子系统以并行计算的方式进一步提高计算性能,这涉及到反投影算法的并行化以及并行算法向多个计算单元映射的问题。本文在原始的像素并行方案的基础上设计了脉冲并行方案,并重新设计了反投影子系统的架构,对于集成了8个反投影加速核的反投影子系统,主存储器的访存带宽需求和片上像素存储器组的数量均降低了87.5%.相比于单个反投影加速器,以完全相同的片上像素存储器、完全相同的主存储器访存带宽和8倍的反投影加速核和片上脉冲存储器取得了大于7.99的加速比。此外,针对开发过程中算法仿真时间过长的问题,本文还尝试了通过GPU并行计算的方法加速Backprojection雷达成像算法仿真。结合GPU计算平台和算法的特征分析,选择了像素并行的方案进行加速,原来需要仿真时间5小时23分钟经过GPU加速后只需要3分20秒,加速比达到97倍。
其他文献
学位
学位
该文对毫米波准光天线馈电系统中的关键部件--准光天线收发转换开关进行了理论分析和实验研究.文中首先对毫米波段中准光技术的基体理论,诸如高斯模理论、波束传输技术、毫米
近几年,全世界环境和能源问题日趋严重,太阳能光伏发电作为一种清洁能源越来越受到人们的重视。但是与传统化石能源相比,光伏发电的价格仍然较高,通过采用聚光技术,可以降低光伏发
SI电路是一种电流模式的模拟采样数据信号的处理电路.该文介绍了电流模式模拟信号处理的发展概况;系统阐述了基本SI电路及其时、频域分析方法;通过设计一个二阶巴特沃低通SIF
学位
学位
RF MEMS开关由于其低插损、低功耗、体积小以及易于集成等优异特性而成为了近年来国内外研究的热点。本论文围绕K波段并联电容式MEMS开关的设计而展开,具体做了以下的研究工作:论文首先详细的讨论并联电容式MEMS开关基础理论,包括力学分析和电学分析,为后面的开关设计打下基础。然后,论文重点研究开关介质层、梁宽、信号线与地线上方开关梁结构以及共面波导缺陷地结构对电容式MEMS并联开关的性能的影响,并
电磁超材料(Metamaterials: MTMs)以其不同于传统材料的许多特殊电磁特性,成为近年来研究的热点。它是介电常数和磁导率同时为负的一种人工合成材料,表现出一系列反常的电磁特
辐射环境下,绝缘体上硅(Silicon-on-Insulator,SOI)技术具有抗单粒子翻转和瞬态辐射的优点,但总剂量效应更加复杂。离子注入可以提高绝缘埋层抗总剂量能力,然而会引起顶层硅损伤