基于YARN的FPGA异构集群系统研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hqc12322967
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在Hadoop平台上集成FPGA进行算法加速的研究受到了广泛关注。通过利用Hadoop将计算过程在节点之间并行,以及在单个计算节点上利用FPGA硬件加速,这些研究对特定算法的加速上取得了很好的效果。但是,它们大多假设集群计算节点同构,没有在集群层面对FPGA加速器资源进行统一的管理和调度,应用程序开发复杂程度高。而且,整个集群的软硬件结构为运行某一特定的算法高度定制,通用性差,资源利用率较低。另外,受限于FPGA计算逻辑固化的特点,已有的在Hadoop集群中管理其他计算加速设备的方法不适用于管理FPGA加速器。YARN资源管理平台的出现为FPGA资源统一管理提供了可能。结合FPGA加速器逻辑专用性的特点,采用资源表示维度扩充和基于标签的资源调度相结合的方法对YARN平台进行扩展,扩展YARN平台能够在包含多种FPGA加速器的异构集群中对FPGA加速器资源进行统一的管理和调度。同时,扩展平台隐藏了FPGA加速器在集群中的位置分布,为应用程序申请和使用加速器提供了统一的接口。此外,通过对YARN平台上的计算框架的资源申请和子任务执行逻辑进行扩展,扩展计算框架在保持原有计算模式不变的基础上具备在运行过程中申请和使用FPGA加速器的能力。在扩展YARN资源管理平台下同时运行普通应用程序以及FPGA加速的应用程序的结果表明,扩展平台在具备了FPGA资源管理和调度能力的同时,保持了对原生YARN平台上的各种计算框架的支持,使得集群通用性和资源利用率都有了很大的提高。在扩展框架下编写并运行FPGA加速应用程序的实验表明,扩展计算框架简化了FPGA资源的申请和使用逻辑,提高了应用程序开发效率。在目标集群中对算法进行FPGA加速实验的结果表明,输入数据读取速度、节点任务并发数、应用本身的计算复杂度对计算加速比有着决定性的影响。
其他文献
随着互联网的快速发展,海量的数据以网页的形式发布到互联网上。传统的网页是面向用户而设计的,人们可以通过浏览器可视化的阅读信息。然而对于机器来说,这些信息是难以理解
随着互联网技术的迅速发展,网络上的信息呈爆炸式增长,网络技术的发展拓宽了我们获取信息的渠道,然而这些海量信息在给我们的日常生活带来极大便利的同时,也给我们带来很大的
在当今互联网环境下,云存储这一存储服务概念得到了广泛的重视与发展,文件存储服务则是云存储服务的具体应用表现方式之一。文件存储服务由于其具有共享、便携、低成本等特性
在移动互联网时代,安卓智能移动设备越来越成为人们生活中不可或缺的一部分,每天都有成千上万的新型移动应用涌入人们的视野。一些黑客为了获取某些特殊利益,采用重打包技术
图像场景可能由多个对象(比如:草地,马路,建筑物)所组成。给定一组图像,我们的目标是利用无监督方法发现每一幅图像所包含的对象,然后根据这些对象的分布实现场景的分类。潜在语义
如今,在计算机视觉领域,三维重建技术已经得到了迅速的发展,基于图像的三维重建技术因为其硬件要求简单、可实施性较高而得到了更多的关注。基于图像三维重建技术的基础是对
安卓操作系统(Android)具有界面交互性良好、应用程序开发快捷的特点,但其图形框架部分使用Dalvik Java虚拟机,占用大量的系统资源,结构复杂,在工业控制领域的嵌入式设备上移
近几年,电子竞技运动蓬勃发展,已成为一项有益健康的体育项目,与此同时,用户对于游戏对战平台的要求也越来越高。当今主流的游戏对战平台主要研究如何减少游戏数据的分发延时,而对
随着多媒体技术和存储技术的发展,互联网上的视频数据在不断地增长和传播,如何从庞大的视频数据中快速检索到人们感兴趣的视频内容,是亟待解决的问题。视频事件检测与标注工
人脸在人类的交流中起着重要的信息表达功能,人脸呈现的表情传递着人类复杂的情绪和感受。但由于人脸的生理学结构非常复杂,计算机从人脸中提取的特征常常难以直接利用。本文