分布式深度学习平台DisPyTorch

来源 :南京大学 | 被引量 : 0次 | 上传用户：tangtieming1983

【摘要】

：

随着大数据与人工智能的发展,深度学习模型面对的问题越来越复杂,模型参数越来越多,处理的数据集规模也越来越大。为了突破单机计算资源的限制,构建一个高效易用的分布式深度

【作者】

：

师颖毫

【出处】

：

南京大学

【发表日期】

：

2004年期

【关键词】

：

深度学习分布式深度学习 PyTorch 神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着大数据与人工智能的发展,深度学习模型面对的问题越来越复杂,模型参数越来越多,处理的数据集规模也越来越大。为了突破单机计算资源的限制,构建一个高效易用的分布式深度学习平台已经成为学术界和工业界广泛关注的问题。已有的大部分分布式深度学习平台仅支持静态计算图,且都是基于参数服务器单一框架的。相较于静态计算图,动态计算图可以在运行过程中修改或定义图中节点从而能够处理更复杂的网络模型。单一的分布式深度学习框架无法高效地处理不同的现实应用场景,比如网络模型的大小不同、分布式节点的多少不同和各节点计算资源均匀与否等多种场景。目前国际上仍没有一个支持多种分布式框架、支持动态计算图的分布式深度学习平台。为了填补这一国际空白,本文基于PyTorch设计并研发了一个分布式深度学习平台DisPyTorch。为了能够处理各种复杂应用场景,本文在DisPyTorch平台上设计并实现了三种分布式深度学习框架:MR-DisPyTorch、RA-DisPyTorch和PS-DisPyTorch。用户可以根据实际的应用场景选择合适的框架。本文的贡献如下:一、设计并实现了一种基于MapReduce编程模型的分布式深度学习框架MR-DisPyTorch。MR-DisPyTorch框架采用同步更新策略,可用于处理网络模型较小、分布式节点较少以及节点计算效率均匀的应用场景。二、设计并实现了一种基于Ring Allreduce编程模型的非中心化分布式深度学习框架RA-DisPyTorch。RA-DisPyTorch框架采用同步更新策略,可用于处理网络模型较大、分布式节点较多以及节点计算效率均匀的应用场景。三、设计并实现了一种基于参数服务器编程模型的分布式深度学习框架PS-DisPyTorch。PS-DisPyTorch框架支持同步、异步和半同步的更新策略。其中同步更新策略适用于深度学习网络模型规模适中、分布式节点数目适中、节点计算效率均匀的应用场景,而异步和半同步适用于深度学习网络模型规模适中、分布式节点数目适中、节点计算效率不均匀的应用场景。

其他文献

基于表示学习的目标检测与分割算法研究

随着人工智能浪潮的到来,深度学习作为表示学习的一个重要分支,其发展大幅提高了视觉识别任务的最终性能。尽管有着大量的理论、学术研究,但在面对复杂应用环境以及计算资源

学位

表示学习视觉识别模型性能计算代价推断速度

理士国际技术有限公司的财务风险控制研究

企业的生产经营会受到各种各样的因素的影响,经营中各种风险也是难以避免的。铅酸蓄电池以及电子零配件企业的财务风险都有一个逐渐暴露,逐渐恶化的过程,陷入经营危机的企业

学位

财务风险财务风险识别财务风险评价财务风险控制

数据流上的开放学习算法研究

随着计算能力的提高和越来越多的新算法被提出,机器学习技术已经开始广泛地应用在实际生活中,而相比于实验室环境,在将机器学习算法应用到现实场景时,我们仍然面临着很多需要

学位

机器学习数据流在线学习密度估计单类学习半监督学习开放学习

入选股指成份股与企业环境信息披露质量

股指成份股调整是一个信息事件,不仅引起股价波动,而且对企业经济行为产生重要影响,但是相关研究缺乏对企业环境行为的关注。环境信息披露作为企业向外界传递其环境表现的工

学位

沪深300指数环境信息披露双重差分

基于移动汇点的能量有效数据收集策略研究

随着无线传感器网络(WSN)的发展有了新的机遇和挑战,许多研究人员也致力于WSN的研究。无线传感器网络是由许多传感器节点组成的,负责收集感兴趣的数据,这些节点能量有限,并且

学位

数据收集移动sink节点能量消耗无线传感器网络

基于深度信息的自动图像重对焦技术研究

图像的重对焦技术的目标一般是在一张没有焦点的图像中,选择一定区域进行局部对焦,对其余部分进行模糊的柔焦处理,使该区域作为前景从背景中突出出来,整张图像更具有美学感受

学位

自动图像重对焦深度信息估计生成式对抗网络显著性检测

基于静息态功能核磁数据的个体创造力预测

创造力是国家科学技术进步和经济发展的源泉。目前,个体创造性的高低一般通过各种问卷来测量及评定。其测量和评定过程可能夹杂着许多的主观性和不确定性。近年来,开始有学者

学位

机器学习高低创造力分类功能连接特征选择PDM

凝寿寺塔抗震性能仿真分析

砖石古塔作为我国古代高层建筑的杰出代表,不仅具有极高的文化艺术价值,更是我们研究古代建筑施工与结构构造不可多得的珍贵文物。但随着近年地震频发,仅在汶川地震后,便有几

学位

砖石古塔有限元模型倾斜加固时程分析

基于BP神经网络的级联多电平逆变器故障诊断技术研究

级联型多电平变换器具有模块化、易扩展的优点,但级联多电平拓扑主要应用在高压大功率场合,且开关器件工作在高频开关状态,损耗较大,发热严重,发生故障的概率最大,实际运行情

学位

光伏逆变器级联多电平逆变器故障诊断BP神经网络单电流传感器

深度半监督聚类算法的研究

在机器学习中,聚类是一项重要的算法。不同于分类算法,聚类算法在所提供的数据没有标签的情况下,将数据中的各个样本点按照它们的相似度程度划分到不同的族类中。同一个簇类

学位

聚类神经网络深度聚类密度峰值核函数

分布式深度学习平台DisPyTorch

其他学术论文