支持数据路径动态重构的浮点处理器的研究与设计

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:zyhui1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在图形图像、科学计算、大数据分析等高密度计算领域,传统的通用处理器和专用集成电路难以满足高性能和高灵活性的双重需求。可重构处理器将指令流驱动处理器的功能灵活性和数据流驱动处理器的高能量效率结合在一起,因而在高密度计算领域受到了广泛关注。粗粒度可重构处理器以数据流为驱动,基于任务调度可重构阵列的计算过程,适合执行无控制分支和寻址模式规则的计算任务。课题组的异构多核系统面向高密度计算领域,其所集成的通用浮点处理器需要满足高性能和适用性的双重需求。针对高性能计算中非规则寻址模式任务的加速需求,论文设计了一种支持数据路径动态重构的浮点处理器,主要工作和创新点如下:(1)区别于传统的可重构处理器,引入了一种基于融合指令的实现方式。(2)针对浮点计算部件具有硬件规模较大和使用频率差异大的特点,设计了一种相较于交叉开关网络具有较小网络规模的直接互连网络。(3)针对可重构单元对存储器带宽的需求,设计了具有无冲突访问规则的多端口存储器。(4)在可重构处理器中实现了多流水线计算路径的乱序执行和乱序写回,各访存通道根据各访存通道的优先级自动地解决路径间的数据冲突。(5)设计了适用于可重构浮点处理器的编译器,这使得复杂应用程序映射在该处理器上成为可能。论文最后将多个复杂的计算任务映射到可重构浮点处理器上,通过与通用处理器对比证明了该浮点处理器的高性能,通过与其他浮点处理器对比证明了该浮点处理器兼顾高性能的同时相较于已有工作能更好的适应非规则运算。目标应用系统集成了24个可重构浮点处理器,在Xilinx Ultrascale系列xcvu440的FPGA芯片上进行了原型验证,系统可以稳定工作在76 MHz频率。相较于上一代系统,集成可重构浮点处理器的多核系统在执行雷达成像算法时系统性能提升了近2倍。
其他文献
自1895年德国物理学家伦琴发现X射线并得到人类历史上首张X射线图像以来,X射线成像一直是热点研究课题,在医学成像、工业无损检测等领域获得广泛应用。然而,轻元素对X射线的吸收非常微弱,导致传统吸收成像技术不适合用于由低原子序数元素组成的物体。二十世纪九十年代,X射线相位衬度成像方法的提出有效解决了这一问题。在硬X射线波段,轻元素的相移截面通常是吸收截面的1000倍,使得相位衬度图像灵敏度更高,利用
随着大量智能终端和各类新兴应用的出现与物联网等领域的技术进步,未来移动通信系统的部署将会朝着异构化、密集化的趋势发展,异构蜂窝的密集部署将成为未来提高网络容量的一种重要手段,同时这也将会产生更为复杂和严重的蜂窝间干扰,甚至可能导致系统性能恶化。为了解决无线通信中面临越来越大的容量需求和有限的频谱资源这一难题,需要通过蜂窝间干扰协调技术对有限的频谱资源进行合理分配,提高系统频谱效率。然而,未来一代无
随着信息通信技术产业的快速发展,尤其是5G的大规模商用,人们对频谱资源的需求正在快速增加。而现有的频谱资源分配主要采用固定授权的方式,难以满足当前和未来的无线通信需求。为缓解频谱资源的供需紧张,基于认知无线电的动态频谱接入技术应运而生。针对复杂多变的认知无线电网络环境,动态频谱接入技术能够在尽量不影响主用户通信的前提下,允许次级用户利用周围空间的空闲频谱进行通信传输,为频谱的“二次利用”提供可能性
内窥镜在医疗诊断及外科手术中起到关键性的作用。传统的二维内窥镜无法提供组织器官结构的确切位置,不利于医生对疾病的诊断与治疗。为此,本文对双目立体医用内窥镜展开探索,重点对内窥镜图像的预处理及立体匹配技术展开研究。在内窥镜图像的预处理过程中,首先使用Bouguet方法完成原始图像对的立体矫正;然后将原始RGB内窥镜图像转换为不同颜色空间来研究对应直方图均衡化的效果,结果表明,采用YUV颜色空间进行直
自然界中广泛存在的黄曲霉毒素B1(AFB1)由于潜在的致癌性威胁着人类以及动物的健康。酶法降解作为一种有效且环保的方法逐渐被人们应用。但是目前发现的大多数是野生酶,由于野生酶的不稳定性难以被广泛的应用和开发。所以本研究克隆了来自云芝(Trametes versicolor)中的黄曲霉毒素降解酶基因(TV-AFB1D),成功构建p ET-28a(+)-TV-AFB1D原核表达载体以及p PIC9K-
近些年,声通信、声学探测在特殊场合下需求强劲、发展迅猛,但也带来一些掣肘:声波通信器件中传统的声学材料特性限制了调控声波的方式。现如今拓扑材料在声学集成器件中的应用取得了巨大的发展,也成为众多研究者的聚焦点。其主要得益于拓扑材料中多样的色散关系以及奇异特性,通过有目的的设计人工晶体能带结构,实现了声波在人工晶体中高局域、宽带、多频段以及低损耗的能量传播,无疑在生产制造还是基础研究等方面都拥有更多方
毫米波频段由于其具有窄波束和大带宽等特性,近十几年来得到越来越多的关注和开发,基于该频段的无损检测、医学诊断、超高速通信和雷达成像等领域得到蓬勃发展,各类高性能天线的需求日益增加。可重构反射阵列天线在毫米波频段仍具备高增益、波束扫描、波束形成等性能,一直都是相关领域的研究重点。液晶材料在毫米波乃至更高频段内的性能表现十分优异,很适合用作可重构反射阵列天线的可控介质材料。本文针对毫米波相控阵天线的需
雷达在现代信息化战争中起到至关重要的作用,并广泛应用于国防安全领域。而对于雷达舰船目标的检测与识别则是成为了各国争相研究的热点,其中,恒虚警率(Constant False Alarm Rate,CFAR)检测作为一种能根据环境变化来自适应调整阈值的技术,被广泛应用于海面雷达舰船目标的自动检测与追踪。在各国科研人员的不断努力下,众多CFAR检测方法被提出,并在均匀海况下取得了良好的检测效果。然而,
高分辨率的合成孔径雷达(Synthetic Aperture Radar,SAR)图像在图像分类、目标识别等方面有重要的应用。目前,用生成对抗网络的方法提高图像的分辨率已取得了广泛的应用。通过对高分辨率图像的判别可以使生成的高分辨率图像有更多的高频纹理信息。但是,现有的生成对抗网络图像超分辨率重建方法只包含了对高分辨率图像的判别,而忽略了低分辨率图像的作用。这不能保证生成的高分辨率图像可以被准确地
情感在人类认知过程中具有举足轻重的地位。脑电信号(Electroencephalogram,EEG)是脑神经细胞电信号在大脑皮层或头皮表面的总体反映。将脑电信号用于情感识别具有良好的抗伪装性和客观性等特点。由于人体差异性和所处的环境不同,许多个性化因素对脑电的情感识别会产生一定的影响。本文对多种个性化因素在脑电情感识别中的影响展开研究,主要从个体差异、环境差异以及其他生理信号的差异三个方面开展研究