分布式深度学习数据萃取与优化传输方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:averyhut
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着神经网络模型的加宽和加深,以及数据集规模的增大,传统的单机式深度学习训练已不能满足实际应用的需求。为实现高效训练,分布式深度学习成为必须。然而,分布式深度学习中高额的通信开销,也带来了新的挑战。成为当前的研究热点和难点。为了解决高通信开销导致的训练效率降低的问题,基于梯度参数的特性,提出基于量化和压缩的优化传输方法——固定指数压缩法。基于大梯度值有利于收敛的规律,传输绝对值较大的那些梯度,能大幅提高分布式深度学习的通信效率。在固定指数压缩算法中,主要使用了三种优化策略:第一,根据指定的指数阈值过滤梯度参数,大于或等于阈值的部分将被传送,这一步可以增加梯度数据的稀疏性。第二,对过滤后的梯度,使用5-bit量化将每个32位浮点数压缩到5位。为使量化计算更高效,使用多线程的并行计算实现5-bit,大幅提高了量化的效率。同时,将5-bit量化输出的5位分成1位和4位分开存储,提高空间利用率。第三,由于梯度参数的稀疏度增加,对连续的零使用零压缩算法,进一步减少传输的参数量。上述算法在MXNet系统上实现,并使用多种神经网络训练MNIST、CIFAR10、CIFAR100及ImageNet-1K四种数据集。实验结果对比不适用任何压缩算法的基线以及MXNet中的2Bit压缩方法。在梯度压缩率方面,固定指数压缩法达到了16.3~23.3倍的压缩率,高于2Bit固定的16倍压缩率。在训练效率方面,固定指数压缩法比基线加速1.18~3.34倍。与此同时,固定指数压缩法的收敛和基线基本吻合。相比2Bit,收敛的稳定性和准确率都更优。
其他文献
近年来,随着我国水产养殖业的飞速发展,也产生了一些问题,如养殖水体的污染、饲料中添加抗生素引起水产品中的残留、养殖成本高等问题,其中抗生素残留影响到人类的身体健康。
微藻是一类由单细胞或数个细胞组成的微小藻类,直径3~30微米,多为真核生物。微藻生长速度快、单位面积产量高,而且营养丰富,富含蛋白质、维生素和不饱和脂肪酸等。广泛应用于
每一年的春暖花开都让人充满期待。这一次,我们再度相遇上海,在国家会展中心举办的2016年春季家纺展上,不仅欣赏到了数不胜数的创意新品,还领略到了家纺、家具、家饰等元素的跨界组合展现,在这个集聚美丽的展会上,我们看到了、听到了家纺行业发展的各种可能。  回归产品本源 跨界引领消费趋势  27000平方米的展出规模,182家来自全国各地的知名品牌企业,十大重点家纺展团,共聚2016中国国际家用纺织品及
目前,随着视频监控系统的兴起,利用视频监控技术实现管理区域的生产管理、安全管理、人员和物品管理,做到预防在前、取证在后,用最少的人力达到最大的管理效果,因此,在各行各
我国的房地产市场正在发生激烈的变化与重组,多数新房在区位、生活配套设施上的欠缺,导致人们的购房策略开始转向二手房交易市场,这也意味着我国的房地产交易市场将由新房主导的市场向二手房主导市场过渡。在这种情况下,人们对完善的二手房市场信息的需求越来越迫切。准确、及时、完善的二手房价格指数的发布,不仅为政府、房屋中介、房屋买卖双方提供决策参考,而且对房地产市场的健全发展有着至关重要的作用。本文从大数据背景
习近平总书记在治国理政的实践中坚持运用马克思主义唯物辩证法,创新治理和解决社会各领域面临的矛盾和问题,集中体现为运用战略思维、历史思维、辩证思维、底线思维、制度思维等一系列重要的思想方法和工作方法来治理国家。我们可以看到习近平总书记在运用辩证思维尤其是运用矛盾分析法的过程中形成了一系列新理念新思想新战略,对我国经济社会发展起到了巨大的推动作用,因此,本文以习近平治国理政思想的辩证思维为研究对象。首