面向大规模神经网络数据并行训练的运行时系统优化

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:hjpy1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能(Artificial Intelligence,AI)技术经过多年的积累变得日益成熟,其应用领域也不断扩大。其中基于人工神经网络(Neural Network)的深度学习(Deep Learning)技术由于突出的效果而成为了这一领域中的研究热点。随着深度学习研究的展开,神经网络模型逐渐变得更为复杂,用于训练的样本数据规模也在不断增长。由于神经网络的参数特性,通常用于训练的数据越多,训练迭代次数越多,最终训练得到的效果越好,而这些均会导致计算量的增加,最终极大地延长了完成训练所需要的时间。本文基于多节点的CPU+GPU计算平台,针对深度学习框架在分布式训练运行时系统方面的设计进行改进和优化,从而提升大规模深度学习训练的效果,提高计算集群资源利用率,缩短训练耗时。本文的主要内容和成果包括:1.针对开源深度学习框架TensorFlow完成了从TCP/IP到RDMA的移植与优化,提高了分布式环境中不同节点之间的数据传输带宽。本文首先基于Ten-sorFlow中采用的gRPC通信框架进行RDMA移植。随后在TensorFlow框架中更进一步地直接将数据传输部分修改为RDMA实现,最终测试中优化后的Ten-sorFlow 在节点间数据传输时能够达到硬件所能提供的极限带宽。基于优化过程中得到的工程经验,本文最后完成了一套独立的RDMA通信框架,以方便其他同样需求的应用可以得到快速的移植和优化。2.针对分布式数据并行的计算和通信模式设计并实现了多种优化方案,使得分布式深度学习训练得以高效地完成。本文主要采用软件流水线方案来掩盖参数同步造成的数据延迟,配合混合精度训练方案进一步提高神经网络在GPU卡上的训练速度,最后修正了批次归一化方法在分布式环境中存在的问题,对优化算法和超参数进行了一系列调整。最终本文的优化方案在ImageNet数据集中得到了很好的验证效果。本文的部分研究报告及成果已开源,并得到了开源社区中一些开发者的关注。同时,本文的研究结论将为国产处理器环境中分布式深度学习训练的性能优化提供参考。
其他文献
微信作为近年来不断发展的一种新媒体,其自身有着其他媒体不可比拟的强大功能。微信公众平台是腾讯公司在微信的基础上新增的功能模块,通过这一平台,个人、企业、媒体和机构
口语交际能力是现代生活中必备能力之一,《语文课程标准》中明确规定:"口语交际能力是现代公民的必备能力。应培养学生倾听、表达和应对的能力,使学生具有文明和谐地进行人际
国家声誉属于外交政策中的非物质性诉求当中一个重要因素。本文主要围绕国家声誉的本体实在、认识层次、前提假设以及作用条件展开论述。本文首先阐明国家声誉的理性基础是知
词汇教学是对外汉语教学重要的组成部分,但也是其中相对薄弱的一个环节。一般认为汉语词汇教学有三大教学流派,即“词本位”教学法、“字本位”教学法及语素教学法。相比较其
近年,伴随着互联网行业的迅猛发展,大数据、云计算、人工智能等迅速崛起,人们的生产生活方式也发生了改变。城市化进程加快,人们的生活水平日益提高,定制行业的发展迎来了机遇。我国作为农业大国,农业人口众多,耕地分布不够集中,农业生产效率低下。另外,农产品市场价格波动大,农产品售出价格偏低,农产品还存在滞销等问题。在这样的大背景下,出现了一种新型农业发展模式,即“互联网+”私人定制农场。“互联网+”私人定
现有基于图像识别的煤矸石分拣方法实时性较差且整体分拣准确率不高,而基于密度的分拣方法适用于井下初选,成本较高。针对上述问题,设计实现了一种基于EAIDK的智能煤矸分拣系
本实验通过对鲢鱼糜凝胶特性和溶解率的测定及SDS-PAGE、扫描电镜观察,研究大豆分离蛋白(SPI)对微生物转谷氨酰胺酶(MTGase)诱导鱼糜凝胶形成的影响及作用机理。结果表明:SPI
随着网络技术的快速发展,人们对网络的需求日益增长,海量的终端设备接入到网络中,各种个性化定制化的网络服务越来越多,通信网络的数据流量飞速增长。然而,各种新业务的不断涌现,对现有网络架构提出了更高的要求。在传统网络架构中,不同的网络服务需要在专有的硬件设备中实现,当部署新的服务或对现有业务升级时,往往需要更新硬件设备,造成了巨大的费用支出。面对种类繁多的网络需求,当前互联网架构难以实现服务需求的灵活
《瘟疫与人》从瘟疫的角度,由史前时代写至上世纪前半叶,详实探讨瘟疫如何肆虐欧洲、亚洲、非洲等文明发源地,又如何塑造了不同的文明。$$当我们主动探索人类与瘟疫的关系时,须知
报纸
热电材料是一种基于热电效应,能够实现热能-电能相互转换的功能材料,在节能环保等许多领域有广阔的应用前景,受到世界各国的高度关注。近年来,热电材料的研究进展迅速,一些材