面向NLP领域中稀疏模型的分布式训练优化技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:smaboat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习技术发展迅速,在计算机视觉、自然语言处理等领域得到广泛应用。伴随深度神经网络模型的性能提升,模型的参数量、计算量也有了显著的增长,单个计算设备的性能已经不能满足大模型、大数据下的训练需求,分布式训练成为加速深度神经网络模型训练的必要手段。然而,现有的分布式训练优化技术主要针对计算机视觉领域的稠密模型,不能有效应用于稀疏模型的分布式训练。稀疏模型广泛应用于自然语言处理、推荐系统等多个领域,由于在参数存储、梯度表示等多个方面与稠密模型存在区别,导致现有的分布式训练方法不能在稀疏模型上取得有效的加速效果。本文面向自然语言处理领域中的稀疏模型的分布式训练优化技术开展研究,主要工作和创新点如下:针对自然语言处理领域中稀疏模型中稀疏参数量大、通信开销高的问题,提出了一种稀疏感知的混合模型平均优化算法(SA-HMA)。该算法考虑到稀疏模型的稀疏更新特性,将模型的参数划分为稀疏和稠密两个部分,分别采用不同的聚合方式进行模型参数的同步。对于模型参数的稠密部分使用原有的同步算法进行聚合,对于模型参数的稀疏部分使用基于模型平均算法的方式进行聚合。在LM语言模型和NMT机器翻译模型上的实验表明,相比主流分布式训练方法,该算法能分别缩短约76%和58%的收敛时间。考虑到稀疏参数的聚合周期内只有部分参数进行更新的特点,提出了一种基于参数增量的高效模型聚合算法。该算法设计并使用增量数组记录需要同步的模型参数信息。同时,为了避免在参数稀疏程度不高时对增量数组的维护带来的额外开销,设计了一种动态的通信策略选择机制,以在不同的模型下提高训练的吞吐率,缩短训练时间。实验表明,该算法相对于稀疏感知的混合模型平均优化算法,能够进一步提高5%-13%的分布式训练吞吐率,相比主流分布式训练方法,最多能缩短约80%的收敛时间。
其他文献
通过网络问卷调查发现,“双减”背景下小学数学作业设计存在“意识淡薄、内容零散、表征单一和评价滞后”等现实问题。以“课程视域、研究视角和人文视野”为价值取向,有针对性地提出“遵循作业内容与课程目标的一致,克服设计意识的淡薄性”“优化作业要素与整体布局的结构,矫正设计内容的零散性”“做好作业功能与教育价值的衔接,突破设计表征的单一性”“建构设计反思与质量导向的回路,超越设计评价的滞后性”等应对策略。这
期刊
基于互联网的电子商务的快速发展推动了以服装为中心的相关研究。服装解析作为服装领域的一个重要分支,可以为服装图像中的每个像素点分配预定义的语义标签,从而将图像分割为多个语义上一致的区域。由于这些区域能提供背景、服装类别、位置和形状等高层次语义信息,服装解析已成为实现和改进各类服装应用的关键技术。由于服装和场景具有多样性和多变性特点,服装解析过程非常复杂和耗时。此外,由于服装图像数量庞大,传统的手工标
学位
规模化养殖成为现在鸭养殖的主要形式,提高鸭养殖效益,给养殖户提供更高的经济效益。可是在对鸭的大规模饲养中,由于鸭巴氏杆菌病的出现,给养殖户带来经济损失。鸭巴氏杆菌病起病急,致死率高,任何年龄、品种的鸭有可能患病。利用饲养科学管理防治鸭巴氏杆菌病是当前养殖户重点关注的课题。该文对鸭巴氏杆菌病的流行特点展开研究,做好疾病防治和饲养科学管理,提升鸭养殖的品质。
期刊
依照课题研究型品管圈活动步骤,针对急性心肌梗死患者心脏性猝死急救管理现状,基于结构化思维与金字塔原理,构建了急性心肌梗死患者心脏性猝死急救管理体系。这使急性心肌梗死患者抢救成功率提升至71.4%,1 min内电除颤率提升至100%,萨勃按压部位精准率提升至100%,心肺复苏开始时间缩短至9 s,萨勃启动时间缩短至23 s,呼吸机启动时间缩短至29 s,提高了急性心肌梗死患者急救效率,改善了患者生命
期刊
Arduino是一款便捷灵活、方便上手的开源电子原型平台,包含硬件(各种型号的Arduino板)和软件(Arduino IDE)两大类,最初由一个欧洲开发团队研发制成。由于该产品良好的性能以及使用的便捷性,正处于公司战略调整、新业务拓展阶段的润达汽车贸易有限公司产生了对其产品的需求,但鉴于该系列产品尚无中文版本说明书,因此对该原文本的汉译成为公司完成产品前期的筛选、采购、投入运用继而开辟新业务线的
学位
低频、宽带、高效振动抑制是舰船、飞机、火箭等装备研制过程中的关键技术。梁、板类结构是各类装备机体的基本结构,如飞机和火箭外壳中的铝合金加筋板结构。受工程应用条件约束,在轻质条件下实现梁板类结构的低频、宽带、高效振动抑制面临极大挑战,传统振动抑制技术尚难以解决这一难题。非线性声学超材料是指具有显著非线性波动/振动特性的声学/弹性超材料/结构(调控声波和弹性波),是超材料领域的新兴前沿研究方向。非线性
学位
随着战争形态的演变,夺取制战场信息权成为夺取战争胜利的关键。军用物联网技术使用海量的传感器对战场信息进行采集和预处理,再将信息回传至指挥决策节点,是夺取制战场信息权的重要技术手段。然而,一方面,战场频谱资源非常有限,因此使用海量的军用传感器节点要求使用具有高频谱效率的战场通信技术,从而保证这些传感器节点能够接入网络并完成其所承担的战场任务。另一方面,为大量传感器更换电池是工作量巨大的,为保障军用物
学位
睡眠质量决定人们的精神状态,长期失眠会严重影响人们身体健康,并且导致记忆力下降。本文综述了五味子、人参、酸枣仁、玛咖、茯苓、苹果、枸杞、刺五加、银杏叶等常见的药食同源物质改善睡眠和记忆的功效。
期刊
温稠密物质(WDM)是天体物理和惯性约束聚变(ICF)等领域研究的重要内容之一。考虑到温稠密物质中电子部分简并、部分电离特征,电子的量子效应和电子离子的非绝热碰撞都成为影响温稠密物质性质的重要因素。本文采用电子力场方法(EFF),考虑电子离子耦合动力学,研究了非绝热效应对温稠密物质电子离子输运性质的影响。首先,计算了温稠密氢的离子自扩散系数。对比电子力场方法与第一原理分子动力学模拟结果发现,非绝热
学位
目的:对检测杏仁露中蛋白质含量的凯氏定氮法条件进行优化。方法:以蛋白质含量测定结果为指标,采用单一变量法优化半自动定氮仪测定杏仁露中蛋白质含量的最佳条件。结果:优化后的条件为取杏仁露5 g,加入硫酸铜0.3 g、硫酸钾2 g、硫酸10 mL,炭化后继续加热消化40 min,蒸馏后加入氢氧化钠溶液50 mL。测定结果均采用3份平行样的平均值,3份平行样的RSD均小于0.5%。结论:优化后条件检测杏仁
期刊