数据中心RDMA网络资源复用与应用加速研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:pingli_lp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
远程内存直接访问技术(RDMA)允许应用绕过远端CPU,直接访问远程机器的内存,并将协议栈卸载到网卡来向数据中心应用提供超低的延迟,减少网络通信需要的计算开销。然而,一方面由于RDMA将网络连接存储在空间有限的网卡缓存中来加速网络IO,当通信连接数量过多时会导致网卡缓存命中率低,网络IO性能急剧下降。现有解决方案在本地多个通信线程间使用互斥锁来共享底层网络连接,减少与相同结点通信连接的数量,但存在锁竞争开销大且无法为多个线程提供公平服务的问题。另一方面,网络通信一直是分布式机器学习的瓶颈,当前使用RDMA加速分布式应用的研究仅考虑在小数据通信场景下对传输服务类型和通信原语的选择,没有考虑应用移植时网络通信接口语义不匹配,以及更多影响RDMA性能的因素包括网络连接参数选择,网络缓冲区管理,PCIe传输效率等问题,因此无法为分布式机器学习应用提出系统的有效加速方案。本文的第一个工作针对现有基于互斥锁资源复用方式存在性能瓶颈,接收队列无法在多个应用间复用的问题,且结合资源共享下保障应用服务公平的需求,在系统层面对底层网络资源进行复用,设计抽象连接和异步请求处理来向上层多个应用提供网络服务。本文还通过实验来指出网卡队列服务存在队头阻塞和粗粒度调度问题,并通过在资源复用层设计流量自动切分和公平入队算法来保障多个网络连接和不同优先级流量之间的公平服务。本文使用的资源复用方式的好处在于:相比已有的方法,我们可以消除锁竞争带来的性能瓶颈,为整个物理机上的所有应用共享底层网络资源,有效的降低资源使用总量,同时向网络连接提供公平服务。本文的第二个工作在前一个工作的基础上,针对应用无法完全获得RDMA的最大性能问题和分布式机器学习框架MXNet的通信瓶颈问题,通过设计socket语义兼容的RDMA网络接口,对队列流水线长度参数调优,设计应用无关的网络缓冲区管理模块,使用流水线式内存拷贝和按需缓存来自适应优化小数据传输的延迟和大数据传输的计算资源开销,为分布式机器学习框架MXNet提供系统性的加速方案。本文通过系统实现并在真实环境中实验来验证我们方法的有效性。通过实验和分析,我们的资源复用方式能够消除锁竞争的开销,为1024个虚拟连接下复用单个QP并维持RDMA原有性能,同时能够保证公平服务。本文提出的新的RDMA网络接口可以为MXNet中的参数服务器提供5到9倍的性能提升,为分布式手写数字识别算法提供2倍的性能提升。
其他文献
学前教师的职业精神和职业素养,对学前儿童的发展和幼儿教学的整体质量有着至关重要的作用。重视教育师范生法律素养的培养,也是新形势下教育教学发展的需要,符合素质教育的
2004—2005年度人民文学奖在京颁奖,10部优秀作品获此殊荣。优秀诗歌奖则由诗人雷平阳的《秋风辞》和刘川的《这样或那样》分享,其他奖项还有:获得优秀中篇小说奖的是山西女
<正>晚清时,湘系人物林林总总,卓荦英杰代不乏人,其中有"三亮"之说,即被赞誉有诸葛亮之才的,他们是左宗棠、刘蓉、郭崑焘。同时,他们还有一个共同点,就是都出身幕僚。"山川资
<正> 湖南省溆浦县江口镇茶湾村发现一女性村民,虽年逾百岁,却耳聪目明,精力充沛,不仅掉牙后生出了新牙,而且还满头乌发。这位百岁老人,名叫舒治玉,出生于1893年5月14日,至今
期刊
中职生也受此影响,浮躁、迷茫、人际关系敏感、偏激、自卑等心理问题越发突出如何让学生控制自己的情绪,避免冲动,在学习与生活中踏踏实实地完成每一项任务并保持一颗平静的
首先在理论上对于Wilkinson功分器的隔离电阻,特征阻抗等相关参数进行了分析,然后使用ADS仿真软件设计了一款工作在300~500MHz的Wilkinson功分器,其带内输入端口的回波损耗:C1
<正> 青春年华的悄然逝去,给每一位女性心中留下了深深的遗憾。古往今来,为留住易逝的青春,产生了数不胜数的美容之法,如药物美容、经络美容、自律神经美容等等。美容业的兴
介绍了二氧化钛光催化剂的几种制备方法、负载技术和离子掺杂技术,对在废水处理方面的应用作了详细综述。
高压联合钢岔管整体结构的合理性对其安全运行至关重要,在钢岔管中间开孔引水满足下游生态需求,联合受力钢岔管势必对超压旁通管受力会产生一定影响。通过3个方案对钢岔管整