基于RDMA的数据传输机制优化与实现

来源 :国防科技大学 | 被引量 : 0次 | 上传用户：a281000075

【摘要】

：

伴随着“互联网+”时代的飞速发展,国家大数据战略的颁布实施以及人工智能时代的到来,各大互联网公司都意识到数据将成为未来的石油,都开始主动根据人们的衣食住行获取大量数

【作者】

：

王元波

【出处】

：

国防科技大学

【发表日期】

：

2004年期

【关键词】

：

RDMA Apache Spark Shuffle Infiniband 网络库

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

伴随着“互联网+”时代的飞速发展,国家大数据战略的颁布实施以及人工智能时代的到来,各大互联网公司都意识到数据将成为未来的石油,都开始主动根据人们的衣食住行获取大量数据。新型硬件设备(NVMe SSD、支持RDMA的网卡、3dXpoint等)的广泛使用,它们的性能无论延迟还是带宽都比以前快了几个数量级,这时传统软件层的时间开销就随之凸显了出来。Apache Spark作为目前业界最流行的分布式处理系统,广泛应用在数据分析、交互式数据查询、机器学习等领域。Spark作为在MapReduce基础上发展起来的分布式系统,其Shuffle过程涉及到非常耗时的网络IO和磁盘IO,目前Shuffle性能是决定Spark整体性能的瓶颈之一。目前支持RDMA协议的25Gb以太网已经在国内主要互联网公司大规模部署,探索RDMA技术和Spark的深度融合是一个具有现实意义的研究工作。本文在高性能计算领域常用的Infiniband体系下,进行的工作和创新如下:使用RDMA技术进行网络传输的数据所在的内存空间,必须首先将内存元数据注册到网卡中,由于注册操作需要经过PCIe总线,因此这是一个比较耗时的操作。本文综合参考当前主流内存分配器,在Boost.Pool的基础上设计实现了一个分层RDMA内存池,达到RDMA内存的重复利用,减少每次的注册开销。实验结果表明该内存池能很好适应多线程竞争情况,达到比较高的效率。RDMA为数据传输提供多种模式和操作,它们都有不同优点和缺点,适合不同的应用场景。本文将数据按照一定阈值分为大小数据块,对于小数据块使用RDMA write_with_imm操作直接将数据写到远程一个指定的内存区域,对于大数据块先使用RDMA write_with_imm将写入数据元数据,远程节点再根据这些元数据使用RDMA Read操作将数据传输到远程内存中。这种数据访问机制根据不同规模数据使用不同传输模式,有效兼顾了通用和效率。在前面两个铺垫下,本文设计实现了一个通用的高性能RDMA网络库——baiyun。Baiyun在面向用户的编程模型上参考netty,具有简单易用等特点,在网络事件处理上基于开源项目brpc,使用用户态线程和执行队列等技术方案,实现通用化高性能目标。最后,本文基于baiyun设计实现了Apache Spark的Shuffle机制的优化。主要思想是将Spark Shuffle中的网络模块通过JNI替换为baiyun,通过将操作流水化达到比较高的效率。实验结果显示,优化后的Spark Shuffle性能得到大幅度提升。

其他文献

以TiO2/KIT-6为载体的催化剂制备及其光催化苯甲醇氧化和胺化反应的研究

由于Au纳米粒子具有表面等离子共振（SPR）效应,可以吸收和利用可见光,常被用作光催化剂,尤其是对催化氧化反应,具有很高的催化活性。本文选用TiO2修饰的KIT-6作为载体,制备出一

学位

AnTiO2/KIT-6光催化苯甲醇亚胺

喉上神经阻滞联合右美托咪定在婴儿唇腭裂手术中的应用

目的探讨喉上神经阻滞联合右美托咪定并保留自主呼吸气管插管用于婴儿唇腭裂手术的实用性和可行性。方法选择本院2010年1月到2015年3月底各项检查结果在唇腭裂修复手术允许的

期刊

喉上神经阻滞右美托咪啶麻醉全身腭裂唇裂

夹脊电针对脊髓损伤后大鼠c-fosmRNA及BNIP3 mRNA表达影响的实验研究

目的：观察夹脊电针对大鼠脊髓继发性损伤后C—fosmRNA及BNIP3mRNA表达及其变化规律，以及对CBS运动功能评分的影响，观察夹脊电针对脊髓损伤后神经细胞的保护作用及凋亡机制。方法

期刊

夹脊穴电针脊髓损伤c-fos mRNABNIP3 mRNA细胞凋亡

用计算机寻找影响大型工程经济性的主要因素

探讨了用改进的多元逐步回归分析法进行企业经营指标的预测与评价,包括对企业历年经营成本与销售收入的合理性评价,以及对未来年度企业生产成本及销售收入的预测.以前多元逐

期刊

逐步回归法多元回归计算机软件企业管理经营预测经济指标

弯管内气固流动特性的实验研究

浓淡煤粉燃烧是一种能够同时实现锅炉的低NOx排放和低负荷稳燃的新型燃烧技术。在燃烧器前加装煤粉浓缩器是目前浓淡煤粉燃烧技术中应用最普遍、最简单的方法。在锅炉一次风

学位

弯头气固两相流动PDA

岩溶隧道地质预报的几种主要方法及应用研究

研究目的：我国是世界上岩溶分布面积最广的国家之一,岩溶分布纵深横广,除了形成北方以山西为中心、西南以贵州为中心的两片面积瞩目的岩溶高原外,还有着更为广阔的地理环境跨

期刊

岩溶地质预报方法准确度分析

肺炎嗜衣原体Ⅲ型分泌系统效应蛋白的预测、筛选及免疫活性研究

目的:预测、筛选肺炎嗜衣原体(Chlamydophila pneumoniae,Cpn)III型分泌系统(Type III secretion system,T3SS)效应蛋白编码基因,并研究其免疫活性,探讨预测的T3SS效应蛋白重

学位

肺炎嗜衣原体Ⅲ型分泌系统效应蛋白免疫活性

60GHz无线通信系统幅度接收误码率分析

随着第四代无线通信技术的研究以及数字媒体技术的发展，人们对无线传输速率和信号带宽的需求日益增大。能够实现数吉比特数据传输速率、拥有高达7GHz免许可频谱和最高达10W发

学位

60GHz无线通信幅度接收机误码率最佳判决门限相关接收机

粉末冶金NbMoTaWVX(X=Cr,Ti)难熔高熵合金的组织及性能

高熵合金以其新颖的合金设计理念,开辟了全新的金属材料研究领域,且高熵合金具有高强度、高硬度、良好的高温性能、优异的耐磨和耐腐蚀等特性,吸引了国内外学者的广泛关注。

学位

难熔高熵合金机械合金化放电等离子烧结显微组织力学性能

贯彻落实《决定》精神加强电大党的建设

<正> 《中共中央关于加强党的建设几个重大问题的决定》明确指出:"学校党的建设要围绕学校的改革和发展,加强和改进德育工作,培养有理想、有道德、有文化、有纪律的社会主义

期刊

电大系统人生观德育工作建设有中国特色社会主义理论《决定》加强党的建设加强和改进领导班子改革和发展社会主义市场经济体制社会主义现代化建设教职

基于RDMA的数据传输机制优化与实现

与本文相关的学术论文