面向SIMD计算平台的FFT算法实现与优化关键技术研究

来源 :贵州财经大学 | 被引量 : 1次 | 上传用户:zhoudddmmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
快速傅里叶变换(Fast Fourier Transform,FFT)是最重要的基础算法之一,在科学计算、信号处理、图像处理等领域都有着广泛的应用。随着这些应用领域对实时性需求的进一步提高,快速傅里叶变换算法面临着越来越高的性能要求。在现有的FFT算法库中,FFT算法的求解速度和计算精度受到一定程度的限制,而且也少有研究者对基于SIMD计算平台的偶数基Cooley-Tukey快速傅里叶变换的高性能实现提出相应的优化策略并对技术方法进行深入研究。基于此,提出一套针对偶数基的Cooley-Tukey快速傅里叶变换的优化策略和方法,即首先构建一个SIMD友好、支持混合基的蝶形网络,然后根据偶数基旋转因子特性最大限度地降低蝶形计算的复杂度,接着通过SIMD汇编优化、汇编指令重排及选择、寄存器分配策略制定、高性能矩阵转置算法等方法来优化应用,最后实现一个高性能的FFT算法库。目前,最流行、应用最广的FFT有FFTW和Intel?MKL FFTW。实验结果表明,在SIMD计算平台,ARM v8架构和X86架构上,新提出的这套主要针对偶数基Cooley-Tukey FFT的技术方法所实现的FFT算法库的性能全面优于开源FFTW和Intel?MKL FFTW。新提出的这套高性能算法优化和实现技术方法体系,可推广到除偶数基以外的其他radix的实现和优化上,为进一步的研究开发工作奠定一定的基础,进而突破FFT算法在各硬件平台上的性能瓶颈,实现一套针对特定平台的高性能FFT算法库。
其他文献
随着各个国家工业化和人民生活水平的提高,建筑业的蓬勃发展,导致建筑耗能占国家总能耗的比重将越来越大,建筑节能的重要性越来越明显。本文以天津市某双层玻璃幕墙建筑为例,
21世纪以来,随着纳米技术的不断发展,纳米材料在电子芯片制造、封装,生物医药,能源、交通等高技术领域有着越来越广泛的应用。相比于传统半导体制造技术,纳米技术在三维纳米
近年来,随着城市地下空间不断开发和轨道交通建设的大力发展,地铁车站深基坑工程的建设也在与日俱增。深基坑在开挖和降水共同作用下的变形问题已成为了地铁建设中重要的研究内容。本文依托于南宁地铁3号线青秀山站深基坑工程,根据深基坑的半成岩地层环境及开挖特点,提出了合理的施工方案,并且建立了三维有限元计算模型,全面细致地分析了在降水条件下施工对深基坑与周围环境的影响因素及变化规律,主要取得的研究成果如下:(
刚性接触网起初的设计是考虑地铁车辆一般不高于80km/h的低速行驶,但随着科技的发展以及交通运输市场的需求,刚性接触网不仅仅运用于城市轨道交通,干线铁路隧道内对刚性接触网也有了需求,且刚性接触网在提速方面已经有了较大进步。我国多条干线铁路特长隧道内采用的刚性接触网运行速度达160km/h,最高时速160公里的北京新机场线即将建成通车,最高速度达200km/h的川藏铁路正处建设初期,在此背景下开展了
今年以来,淄博市张店区着力建设区、镇、村三级党员政治生活馆,推动基层党员找回初心、学新思想、熔炉再造、查摆不足,不断增强党内政治生活的政治性、时代性、原则性、战斗
内置式永磁同步电机具有体积小、机械强度高、低速输出转矩大等特点,已逐渐应用于城市轨道交通领域。通常情况下,为了实现高性能传动控制,需要加装机械传感器用于检测转速与转子位置,然而,机械传感器的存在会增加系统的成本与体积,并且当运行于恶劣环境下时,传感器的精度会受到影响,进而降低系统控制性能。为了提升系统运行性能,增加可靠性,永磁同步电机的无传感器控制技术已成为传动控制领域的研究热点。本文的具体研究工
历史街区的保护和规划是城市发展进程中重要的环节,而在历史街区的开发和利用方式问题上则一直存在较大的争议。大栅栏地区作为北京二十五片历史文化保护区、全国首批三十个
我国目前机动车持有量呈快速上升的趋势,日益增长的出行需求对交通系统运行效率提出了更高的要求。在交通分配领域的学术研究中,动态交通分配模型刻画交通流从非平衡状态到平
零样本学习是指通过学习对象类别的语义描述和图像的视觉描述的嵌入空间来识别从未见过的图像类别。现有零样本学习模型一般是对视觉和语义空间的映射关系进行研究,侧重于映
职业培训是提升员工知识技能的重要手段。然而,随着社会发展,自由放任的职业培训逐渐暴露出诸多问题,例如培训供需不平衡和“搭便车”问题。培训积极性的下降导致劳动力市场