无损网络下交换机实现

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:softdir
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:面对高性能计算、大数据分析和浪涌型IO高并发、低时延(集中式网盘)应用,RDMA技术可以提供极低的延时和更高速的数据传输处理。RDMA技术要求的无损网络通过在交换机上支持RoCE协议来实现。而RoCE协议中的PFC,ECN等水线设置可以通过静态配置或者动态配置算法来实现低延时和无损传输,本文主要就这些水线参数的设置做理论推导分析,可以作为水线调参优化的理论原则。
  关键词:RDMA;PFC;ECN
  中图分类号:TP393文献标识码:A
  文章編号:1009-3044(2019)34-0050-03
  1 概述
  面对高性能计算、大数据分析和浪涌型IO高并发、低时延(集中式网盘)应用,现有TCP/IP软硬件架构和应用高CPU消耗的技术特征根本不能满足应用的需求。RDMA是一种远端内存直接访问技术。RDMA最早专属于Infiniband架构,随着在网络融合大趋势下出现的RoCE和iWARP,这使高速、超低延时、极低CPU使用率的RDMA得以部署在目前使用最广泛的以太网上。
  基于InfiniBand的RDMA是在2000年发布规范,属于原生RDMA。
  基于TCP/IP的RDMA称作iWARP,在2007年形成标准,主要包括MPA/DDP/RDMAP三层子协议。
  基于Ethernet的RDMA叫作RoCE,在2010年发布协议,基于增强型以太网并将传输层换成IB传输层实现。RoCE(当前已发展到RoCEv2版本)是基于无连接协议的UDP协议,相比面向连接的TCP协议,UDP协议更加快速、占用CPU资源更少,但其不像TCP协议那样有滑动窗口、确认应答等机制来实现可靠传输,一旦出现丢包,RoCEv2需要依靠上层应用检查到了再做重传,会大大降低RDMA的传输效率。
  基于RDMA的要求,数据中心交换机要求具备如下特性:
  1)零丢包,不造成重传时延,保证分布式高性能应用的高效稳定。通过PFC和ECN水线设置实现零丢包特性。
  2)低时延,特别是网络中的动态时延包括内部排队时延和丢包重传时延,这部分延时占了网络整体时延的99%
  3)高吞吐,满足高性能服务器对带宽的需求,减少报文排队,确保分布式高性能应用中大数据传输的吞吐。当前数据中心交换机为了支持高性能服务器,带宽已经演进到25G/100G,未来1-2年内还会继续演进到50G/200G/400G。
  2 RDMA应用拟合模型
  数据中心流行的CLOS网络架构:Spine Leaf网络架构。CLOS网络通过等价多路径实现无阻塞性和弹性,交换机之间采用三级网络使其具有可扩展、简单、标准和易于理解等优点。除了支持Overlav层面技术之外,Spine Leaf网络架构的另一个好处就是,它提供了更为可靠的组网连接,因为Spine层面与Leaf层面是全交叉连接,任一层中的单交换机故障都不会影响整个网络结构。这种架构下不可避免会出现多打一的情况,而这造成网络丢包最大的原因。而解决这种情况下的网络丢包主要就是在交换机上实现PFC和ECN相关水线的合理配置。
  PFC是DCB的一部分,它适用于DCB网络中的全双工的点到点链路。PFC是对IEEE 802.3定义的流控机制的增强,用于在一个链路上消除由于拥塞而导致的丢包。它的增强在于它是基于优先级的。传统的流控机制中,当某条链路出现拥塞时流控会阻止该链路上的所有流量。交换机的MMU水线主要有PG Guaranteed,PG Dymanic Pool(可通过α动态分配每个端口的水线),headroom值,其中headroom的就是在多打一的流量模型下,入口出现拥塞后为无损队列设置的缓存空间,当缓存使用超过其中的headroom水线后,就会出现丢包。
  RoCEv2定义了RoCEv2 Congestion Management (RCM),其中拥塞管理用的特性ECN(RFC 3168)是在交换机出口(egressport)发起的拥塞控制机制。当交换机的出口buffer达到设定的阈值(ECN门限)时,交换机会改变数据包头中的ECN位来给数据打上ECN标签,当带ECN标签的数据到达接收端以后,接收端会生成CNP(Congestion Notification Packet)并将它发送给发送端,CNP包含了导致拥塞的flow或QP的信息,当接收端收到CNP后,会采取措施降低发送速度。可见ECN是基于TCP flow或RDMA QP的拥塞控制机制,它只对导致拥塞的flow或QP起作用,不会影响到其他的应用,交换机的ECN水线主要是Queue Dynamic Pool(可通过α动态分配每个出口队列的水线)。
  网络无损主要就是在使能ECN或者PFC的相关MMU水线通过合理配置,由于PFC有死锁和风暴问题,因此在端口拥塞状态下,在确保不丢包的情况下,ECN机制要先于PFC机制产生,需要合理设置ECN门限,使得ECN门限和PFC门限之间的缓存空间能够容纳ECN拥塞标记之后到源端降速之前这段时间发送过来的流量,尽可能地避免触发网络PFC流控。
  以下是在多打一,多打多流并发模型下,推导下这几个水线值应该满足哪些条件可以实现网络无损传输。
  2.1 Headroom水线配置
  主要用于缓存设备触发PFC,到PFC实际生效这段延时期间仍在发送的报文流量,影响的几个因素主要有:
  接收端设备触发PFC流控是光纤线路上残留的报文流量,和线路传输延时相关,记为tl;
  接收端设备触发PFC生成PFC报文并准备发送的处理时间t2;
  接收端设备发送PFC报文前等待未发送完成报文完成传输的延时t3,延时和报文长度有关,最大为出口mtu;   接收端设备发送PFC报文的时间t4;
  PFC报文在线路上的延迟时间t5(与tl相等);
  发送端设备接收PFC报文处理并下发停止报文发送指令的延时t6;
  发送端设备发送殘留的未发送完成的报文流量,转换为延时t7,延时和报文长度有关,最大为出口mtu;
  报文长度:芯片中cell为固定大小,不同长度报文占用的cell数和cell利用效率不同,比如64字节报文cell空间利用率低;
  分析上面各个延时可以看出:
  t2、t4、t6时间基本是确定的,可以通过基准测试测量;
  tl(t5)线路延时可以计算,和光速和端口速率相关;
  T3、T7不固定,取决于报文剩余长度,范围为[0,mtu]字节。
  2.2 保证缓存配置
  PG guarantee buffer用于在某些端口/PG拥塞且占用大量buffer情况下,未拥塞端口仍有保证正常转发的buffer可用,不受拥塞端口影响。
  一般配置为保证一个最大报文可以通过的cell数目,即(MTU cell_size-lycell_size
  TD2 cell size为208byte, TD3为256byte。
  2.3 入口PG和出口queue的alpha配置
  在Dynamic share模式下,通过alpha值动态控制缓存使用的水线。
  水线值Thd=alpha*x,x为MMU中可使用的buffer个数,al-pha可取值1/64,1/32,1/16,…,1,…,8;水线值Thd根据剩余缓存数目动态变化。
  当使用缓存数Y达到缓存水线Thd时,达到动态平衡,若共享缓存总数为B,对于单个端口情况,此时:
  3 结束语
  本文通过流量模型抽象,并结合交换机ASIC芯片的无损转发实现原理,推导出了适合于RDMA业务的无损网络下主要芯片参数的水线设置原则,在满足这些原则下,在该原则下可以确保网络传输是不丢包,各个参数可以基于实际的网络模型、服务器性能再进一步调优,确保整个网络得到最低的延时和最高的转发性能。
  参考文献:
  [1] ODCC.无损网络技术与应用白皮书[Z],2018.
  [2] Mellanox WHITE PAPER: RoCE in the Data Center[Z],2014.
  【通联编辑:闻翔军】
其他文献
高校计算机基础课程作为一门公共课,目的是培养信息化背景下具有专业实践能力和计算机基础应用能力的创新创业复合型人才。在信息技术全面快速发展的今天,高校应该强化计算机
摘要:论文主要实现了一个基于Android平台的汽车维修服务APP。该系统上是以Android为终端,实现汽车保养模块、美容装饰模块、我的三大模块。APP操作简单易用,界面良好,主要为满足广大车主的需求,解决车主在用车过程中产生的一系列问题。该系统主要包括Android客户端、服务端以及后台管理三大功能结构模块。  关键词:Android;二手市场;APP  中图分类号:TP391 文献标识码:A
摘要:随着计算机的出现及普及,信息对整个社会的影响力越来越大。作为新时代的大学生,必须掌握必备的计算机技能才能适应信息化社会。全国各大高校都在开设计算机基础课程,力求使所有大学生都能掌握计算机基本技能。但在应用型本科院校中存在一些实践方面的问题,本文对此进行探究。  关键词:独立学院;大学计算机技术;改革探究  中图分类号:G642 文献标识码:A  文章编号:1009-3044(2019)31-
摘要:Flash不仅拥有动画创作的能力,同时因其内嵌的ActionScript3.0脚本语言,故而Flash还能进行应用程序的开发工作。ActionScript3.0是一种面向对象的编程语言,使用ActionScript3.0可以控制Flash动画中的对象,增强动画创作的交互性。该文是基于Flash和ActionScript3.0来设计制作的一个简单的九宫格数字华容道拼图游戏。  关键词:Flas
数据库应用技术是计算机科学与技术专业的必修课程,针对该课程目前网络教学过程中存在的主要问题,探索适合基于网络的自主学习模式,使学生在教师的指导和引领下,自主地参加网
摘要:为了提升高职信息类专业的教学质量,创新实训载体,提出一种服务于职业教育的基于CC2541低功耗蓝牙芯片的智能可穿戴手环系统,并对于计步算法和噪声滤波算法进行了设计,同时利用蓝牙通信方式实现了与Android手机通信。通过开放协议,在手机端app发送指令,实现控制手环震动、同步时间、读取和设置计步数据、读取实时加速度传感器数据、创意性增加手环字符串显示等并在手机app端显示出来,在移动互联技术
摘要:《基于微信小程序的微型咨讯系统》采用了springboot mybatis框架对系统进行快速搭建,前台页面使用的是node.js编写的,后台业务逻辑使用JAVA语言编写,采用的数据库是mysql,结合mvc设计模式快速完成微型咨讯系统。该系统主要功能有:各用户查看文章,发表文章;管理发表的文章,为文章进行收藏还有评论回复;管理用户自身发表的文章;修改用户信息;删除文章,删除用户,上传视频图片
摘要:中华传统文化是中华民族的灵魂,是实现中华民族伟大复兴的精神支柱。随着我国对传统文化的不斷重视,通过哪种渠道传播传统文化更容易被人们接受成为文化传播过程中面临的首要问题。近几年手机互联网的不断发展,使手机游戏成为人们喜闻乐见的娱乐工具。在手机游戏中渗透传统文化是传播中华文化的创新表现,也是互联网时代传播传统文化的新渠道。因此,本文主要阐释手机游戏作为传统文化传播新渠道的具体表现和重要意义,以及
摘要:对高职院校大一学生的计算机信息技术知识的掌握程度进行了调查,在调查结果的基础上,提出了大学生计算机信息技术课程的教学改革内容,探究了与之相适应的教学模式。  关键词:计算机信息技术课程;调查结果;教学模式  中图分类号:TP311 文献标识码:A  文章编号:1009-3044(2019)31-0157-02  大学生计算机信息技术课程是高校非计算机专业的大学生必修的一门公共基础课程,其目标
摘要:在目前中职院校教育教学中,计算机网络技术课程在整个课程体系中属于重要的一门,也是计算机专业的必修课程,因而有效开展计算机网络技术课程教学十分重要,也是计算机人才培养的重点要求。在新时期教育教学背景下,中职计算机网络技术教师应当通过有效措施及策略进一步改进教学,以保证课程教学能够得到更加满意的效果,在此基础上更好培养计算机网络技术专业人才,促使课程教学更好发展。  关键词:中职教育;计算机网络