基于RDMA的数据传输策略优化与实现

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:liuji19840718
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据的时代背景下,海量数据的增长,大数据处理框架和深度学习平台不断演进,以更加高效地从海量数据中获取得到有用信息。Apache Spark作为大规模数据处理的快速通用计算引擎,其Shuffle阶段需要访问许多本地和远程机器上的文件,磁盘I/O和网络I/O密集,会对源机器和目标机器上的操作系统造成很大负担。使得Apache Spark无法充分利用高速互连网络所提供的性能优势,致使系统的整体性能不佳。这已成为Apache Spark的主要性能瓶颈。对于深度学习平台技术,研究人员快速认识到深度学习与大规模高性能计算具有着非常相似的特征,开始使用MPI语义的AllReduce进行数据通信。另一方面,随着硬件价格急剧下降,目前大多数数据中心都配备了高性能的高速互连网络InfiniBand,可以利用其高带宽低延迟的特性来实现更为高效的数据传输策略,以加速Spark Shuffle的数据传输和提升深度学习的训练效率。本文基于RDMA技术的特性来进行数据传输策略的研究与优化,主要工作和创新点如下:(1)基于RDMA的Spark Shuffle的设计与实现。基于Apache Spark的系统架构设计,分析Shuffle阶段的数据流动。提出了一种混合方法来支持Apache Spark中的数据通信,将传统的套接字通信与基于InfiniBand的RDMA数据传输相结合,使用RDMA经由Java本地接口(Java Native Interface,简称JNI)来执行Shuffle操作,而Spark中所有其他通信操作仍然调用Netty模块。基于RDMA的设计使用分层内存池来避免频繁的内存分配,并采用使用SEND/RECV和RDMA READ来分别传输小型消息和大型消息。基于RDMA技术来加速Spark Shuffle的数据传输,能够透明地为现有的Spark应用程序带来极大的性能收益。(2)基于RDMA的高性能聚合通信库的研究与实现。针对深度学习中的分布式训练场景,提出了Mobius聚合通信库,其逻辑架构分为传输层、算法层、策略层和输入层。在传输层封装TCP Sockets和RDMA通信,算法层经由接口调用传输层实现,策略层提供对通信协议和通信算法的动态选择。Mobius聚合通信库的性能优于gloo,但距离NCCL2还有一定差距。
其他文献
BiAlO3是一种具有优良铁电和压电性能的新型钙钛矿结构的无铅铁电材料,适合作为高温压电器件材料使用。近年来,随着微电子设备和集成电路的发展,使得铁电氧化物极性表面的理
随着互联网的快速发展,各行各业都有源源不断的数据产生,从这些数据中发现有价值的信息并为相关人员提供决策支持,是当前数据挖掘的主要任务。聚类分析和离群检测是数据挖掘
中等职业教育的任务是培养社会产业链内的高技能职业人才,毕业学生的教育质量好坏直接影响着我国的制造业、信息产业、服务业等其他产业的整体水平。目前教育部门主要通过举
中国是能源消耗大国,人口众多,人均能源拥有率不高,在经济高速发展的今天,能源供给应当十分充足,但我国油气能源仍然需要进口,中亚地区各国与中国是邻居,从前苏联时期,就与中
对于随机振动环境下的一类机械臂系统,本文主要考虑了系统的随机建模与轨迹跟踪控制问题.首先将随机噪声合理的引入到系统中建立随机机械臂系统的动力学模型.然后在一些合理
随着计算机技术的发展,目标识别和目标检测引起了计算机视觉、模式识别和图像处理等领域的研究者的广泛关注,其中相关滤波器算法是当前研究的热点之一。相关滤波器的改进目标
颗粒增强复合材料因其具有诸多优良的力学性能,广泛地应用于航空航天、汽车、生物、军工、核能等重要的工业领域。在颗粒增强复合材料中,增强颗粒的加入改善了材料的性能,但
硫作为化石燃料中丰度第三的元素,其单质产量远远大于需求,因而造成单质硫的大量囤积和由此引发的安全和环境问题。因此,单质硫的应用已受到全球的关注。目前已报道的直接利
近年来,纳米材料被认为是最具潜力的研究课题之一,特别是金属纳米团簇因其优异的光稳定性、较大的斯托克斯位移和较低的环境危害更是引起了研究者们极大的兴趣。贵金属(主要是
无线光通信相对于传统通信独特的优点让其这些年来引起广泛的关注,对于无线光通信技术中的非视距紫外光通信,发送端的光信号经过大气中分子以及颗粒等的散射效应,这种信号通