片内多核分布式处理机制的FPGA实现

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:hngyssh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分布式处理是目前非常流行的一个研究热点,其实现与优化都基于软件平台。本研究提出了一种通过硬件(FPGA)实现片内多核分布式处理机制设计方案。异构多核芯片广泛应用于现今的顶层超级计算机当中,类似的异构处理单元(或计算加速器)也普遍存在于FPGA系统当中。在多核芯片和FPGA系统当中,片上网络对于连接这些处理单元起着关键作用。但是,目前普遍应用的片上网络只用于片上构件和存储接口间的点对点通信。随着系统节点数量的不断增加,传统的编程方法,例如MPI,对片上网络和片下网络的利用率都不高,导致通信成为性能的瓶颈。本研究提出了一种片内多核分布式处理机制(消息传递引擎MPE)的设计方案,作为片上网络的一部分来实现硬件点对点通信和集合通信。一方面,消息传递引擎通过承担通用处理单元的工作负载大幅提高了通信性能。另一方面,消息传递引擎给异构处理单元直接提供了接口,这样可以减少甚至去除操作系统和库周围的数据通道。实验结果表明,消息传递引擎可以大幅度的减少通信时间以及提高整体性能,尤其对于和网络紧耦合的异构计算系统来说。另外,硬件测试结果表明消息传递引擎可以高效率的承担通信任务,使得处理单元在计算上得以充分发挥优势。本设计的硬件平台为赛灵思公司的FPGA开发板Virtex-5,其嵌入的MicroBlaze处理器可作为设计的中央处理器。由于采用了32位RISC(Reduced Instruction Set Computer)优化架构,MicroBlaze核所占用的片上资源非常少,简单且具有很高的性能。本研究在深入学习现有分布式处理软件实现的基础上,用硬件描述语言VHDL在赛灵思公司ISE10.1开发工具中设计了分布式处理中点对点通信和集合通信的基本函数,并对各个函数及整体实现进行了波形仿真验证。用赛灵思公司的开发工具EDK新建硬件工程,并将设计的硬件分布式处理机制添加到硬件工程中,生成网表和比特流等相关文件进行板级验证。
其他文献
可测试性设计使集成电路的测试变得更容易。扫描测试设计作为可测性设计中最重要的技术,却存在测试时间长、测试功耗高的缺点。这使得扫描测试的花费很高。扫描树是一种能有效
随着科技和信息技术的发展,微型打印机作为最主要的信息输出设备,被广泛的应用在日常生活中的各个领域,而且新的应用场景层出不穷,尤其是对移动便携打印机的需求更是与日剧增,比如
近几年集成电路技术发展迅猛,随着集成规模与工艺的不断发展,系统级芯片(SOC)设计已经成为业界热点。商用SOC的设计与开发从前端设计到后端布局布线再到芯片最终Tape-Out一般都需
随着世界经济全球化的不断深入,中国与世界的经济交往越来越密切,对企业的形象—公司简介及其翻译,也提出了更高更严的要求。此外,公司简介具有宣传功能,要能促使该公司及其
目的:为克服常用的骨锉、刻度尺及手术刀柄等功能局限、体积膨松、无防护装置、易致锐器伤等弊端,研制一种模块化多功能骨锉尺。方法:参照国家标准,采用车铣、刨削、钻镗、冲压
【正】 崮河崖村位于日照县县城南7.4公里处。1976年3月上旬,崮河崖大队社员在崮河东岸、崮河崖村东南720米处之东岭(又名下林)取士时发现一批青铜器(图一)。该大队负责同志
由于光纤布拉格光栅具有独特的波长编码特性,现在已经成为光纤传感及光纤通信中的重要器件。由于传感网络普遍应用的是脉冲光源,脉冲光源要求在时域上相邻光栅间距必须大于光
湖南兵器资江机器有限公司有位凭着对工作、学习的热情,相信自己一定能行,靠自学成材的“高级理化检测师”,曾多次被授予“技术革新能手”,被中国人民解放军总后勤部授予“一级技
图像合成是计算机视觉、计算机图形学等领域的重要研究方向,具有着广泛的应用:由一段文字生成图像、图像在不同模态间的转换、图像的修复、编辑、去模糊、超分辨率等。尽管经
目的探讨原发性肝癌患者手术后发生感染的相关因素。方法选取新疆医科大学附属肿瘤医院2012年2月至2015年1月收治的108例行肝切除术的原发性肝癌患者,根据术后是否发生感染分