分布式深度学习平台DisPyTorch

来源 :南京大学 | 被引量 : 0次 | 上传用户:tangtieming1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据与人工智能的发展,深度学习模型面对的问题越来越复杂,模型参数越来越多,处理的数据集规模也越来越大。为了突破单机计算资源的限制,构建一个高效易用的分布式深度学习平台已经成为学术界和工业界广泛关注的问题。已有的大部分分布式深度学习平台仅支持静态计算图,且都是基于参数服务器单一框架的。相较于静态计算图,动态计算图可以在运行过程中修改或定义图中节点从而能够处理更复杂的网络模型。单一的分布式深度学习框架无法高效地处理不同的现实应用场景,比如网络模型的大小不同、分布式节点的多少不同和各节点计算资源均匀与否等多种场景。目前国际上仍没有一个支持多种分布式框架、支持动态计算图的分布式深度学习平台。为了填补这一国际空白,本文基于PyTorch设计并研发了一个分布式深度学习平台DisPyTorch。为了能够处理各种复杂应用场景,本文在DisPyTorch平台上设计并实现了三种分布式深度学习框架:MR-DisPyTorch、RA-DisPyTorch和PS-DisPyTorch。用户可以根据实际的应用场景选择合适的框架。本文的贡献如下:一、设计并实现了一种基于MapReduce编程模型的分布式深度学习框架MR-DisPyTorch。MR-DisPyTorch框架采用同步更新策略,可用于处理网络模型较小、分布式节点较少以及节点计算效率均匀的应用场景。二、设计并实现了一种基于Ring Allreduce编程模型的非中心化分布式深度学习框架RA-DisPyTorch。RA-DisPyTorch框架采用同步更新策略,可用于处理网络模型较大、分布式节点较多以及节点计算效率均匀的应用场景。三、设计并实现了一种基于参数服务器编程模型的分布式深度学习框架PS-DisPyTorch。PS-DisPyTorch框架支持同步、异步和半同步的更新策略。其中同步更新策略适用于深度学习网络模型规模适中、分布式节点数目适中、节点计算效率均匀的应用场景,而异步和半同步适用于深度学习网络模型规模适中、分布式节点数目适中、节点计算效率不均匀的应用场景。
其他文献
随着人工智能浪潮的到来,深度学习作为表示学习的一个重要分支,其发展大幅提高了视觉识别任务的最终性能。尽管有着大量的理论、学术研究,但在面对复杂应用环境以及计算资源
企业的生产经营会受到各种各样的因素的影响,经营中各种风险也是难以避免的。铅酸蓄电池以及电子零配件企业的财务风险都有一个逐渐暴露,逐渐恶化的过程,陷入经营危机的企业
随着计算能力的提高和越来越多的新算法被提出,机器学习技术已经开始广泛地应用在实际生活中,而相比于实验室环境,在将机器学习算法应用到现实场景时,我们仍然面临着很多需要
股指成份股调整是一个信息事件,不仅引起股价波动,而且对企业经济行为产生重要影响,但是相关研究缺乏对企业环境行为的关注。环境信息披露作为企业向外界传递其环境表现的工
随着无线传感器网络(WSN)的发展有了新的机遇和挑战,许多研究人员也致力于WSN的研究。无线传感器网络是由许多传感器节点组成的,负责收集感兴趣的数据,这些节点能量有限,并且
图像的重对焦技术的目标一般是在一张没有焦点的图像中,选择一定区域进行局部对焦,对其余部分进行模糊的柔焦处理,使该区域作为前景从背景中突出出来,整张图像更具有美学感受
创造力是国家科学技术进步和经济发展的源泉。目前,个体创造性的高低一般通过各种问卷来测量及评定。其测量和评定过程可能夹杂着许多的主观性和不确定性。近年来,开始有学者
砖石古塔作为我国古代高层建筑的杰出代表,不仅具有极高的文化艺术价值,更是我们研究古代建筑施工与结构构造不可多得的珍贵文物。但随着近年地震频发,仅在汶川地震后,便有几
级联型多电平变换器具有模块化、易扩展的优点,但级联多电平拓扑主要应用在高压大功率场合,且开关器件工作在高频开关状态,损耗较大,发热严重,发生故障的概率最大,实际运行情
在机器学习中,聚类是一项重要的算法。不同于分类算法,聚类算法在所提供的数据没有标签的情况下,将数据中的各个样本点按照它们的相似度程度划分到不同的族类中。同一个簇类