基于数据并行的神经语言模型多卡训练分析

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：lcmeng

【摘要】

：

数据并行训练神经语言模型,旨在不改变网络结构的同时,大幅度降低训练所带来的时间消耗。但由于多设备之间频繁的数据传输,使得整体加速效果并不理想。该文通过实验对比All-R

【作者】

：

李垠桥阿敏巴雅尔肖桐薄乐朱靖波张俐

【机构】

：

东北大学自然语言处理实验室

【出处】

：

中文信息学报

【发表日期】

：

2018年7期

【关键词】

：

数据并行神经语言模型 All-Reduce 采样 data parallelism neural language model All-Reduce samp

【基金项目】

：

国家自然科学基金（61672138）,国家自然科学基金（61432013）, 中央高校基本科研业务费

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数据并行训练神经语言模型,旨在不改变网络结构的同时,大幅度降低训练所带来的时间消耗。但由于多设备之间频繁的数据传输,使得整体加速效果并不理想。该文通过实验对比All-Reduce算法和基于采样的梯度更新策略在数据传输上的加速效果,使用了四块NVIDIA TITAN X（Pascal）GPU设备在循环神经语言模型上进行训练,两种方法分别可获得约25%和41%的速度提升。同时,该文还针对数据并行方法的适用性以及不同的硬件设备连接方式对传输速度的影响进行了讨论。

其他文献

改革背景下的政府投资基金：特点、问题与对策

<正>党的十八届五中全会通过《中共中央关于制定国民经济和社会发展第十三个五年规划的建议》指出"发挥财政资金撬动功能,创新融资方式,带动社会资本参与投资"。在中国经济进

期刊

政府投资基金政府投融资基金评估投融资模式问题与对策

建立房地产的长效机制释放了什么信号

2016年12月16日闭幕的中央经济工作会议强调：房子是用来住的、不是用来炒的,综合运用金融、土地、财税、投资、立法等手段,加快研究建立符合国情、适应市场规律的基础性制度和

期刊

基础性制度房地产泡沫支柱产业地位家庭租赁家庭购买万科我国房价首付比例其他收入中低收入阶层

中国制造走向世界的领头羊——徐工集团三十年创新实践与启示

装备制造业是国之重器,制造巨头乃兴国脊梁。振兴实体经济,实现中华民族伟大复兴的中国梦,需要造就更多更强能够掌控技术话语权、占领世界行业制高点的创新型领军企业。徐工

期刊

中国制造创新实践徐工集团世界三十年工程机械行业羊实体经济

基于熵加权属性子空间的目标社区发现

该文提出一种基于熵加权属性子空间的目标社区发现方法,挖掘与用户偏好相关的社区。首先,从属性和结构两个方面综合考虑节点间的相似度,利用用户给定的样例节点及其邻居扩展

期刊

熵属性权重社区发现用户偏好entropyattribute weightcommunity detectionuser preferences

打造内地与香港经贸合作的新优势

当前,香港传统优势相对减弱,新的经济增长点尚未形成,住房等民生问题比较突出。解决这些问题,香港不仅要充分利用好《关于建立更紧密经贸关系的安排》（CEPA）等机制,积极参与＂一

期刊

经贸合作发展经济增长产业转型升级医疗服务需求广东河源沿边开放生态资源节点城市物流园区建设购物天堂

测振传感器谐波失真度测量的新方法

本文描述了采用谐波分析法测定测振传感器谐波失真度的新方法。该法简单、快速，且显示直观，是测定小信号高精度传感器谐波失真度的理想方法；还提出了采用单自由度线性无阻尼自由

期刊

测振传感器谐波失真度谐波分析法傅里叶变换单自由度线性无阻尼自由振荡系统harmonic analytical methodtransducer

一种新型粘土稳定剂的合成与应用研究

<正> 1992年4月24日至25日,应我院化工系邀请,法国斯特拉斯堡省高分子研究中心的J.Francois博士来我院进行为期两天的学术交流活动。期间,J.Francois博士着重报告了有关水溶

期刊

有机阳离子聚合物粘土稳定剂

安塞富县组防塌泥浆研究及现场试验

安塞油田富县组泥页岩地层不稳定,塌层井径扩大,长期给钻井工作带来很大困难.为了解决这个问题,通过对富县组泥页岩成份和理化指标的分析,证实该地层不稳定是组成泥页岩的伊

期刊

泥页岩泥浆试验坍塌地层shaleanti-cave in mudfield experiment

Г-环上的Lanski定理

本文把环论中著名的Lanski定理推广到Г—环上,同时给出了Г—环R以及Г—环R的子Г—环N是T—幂零的充要条件。

期刊

F-环Lanski定理Γ—ringТ—nilpotent of Γ ring

玛丽莎·利奇：智库如何在复杂环境下运行

＂智库所发挥的作用已经达到最新的历史高度。＂5月16日,英国发展研究所（IDS）所长玛丽莎·利奇（Melissa Leach）应国务院发展研究中心之邀,出席该中心举办的＂国家高端智库建设大讨

期刊

智库利奇丽莎国务院发展研究中心运行环境专题讲座运作经验

基于数据并行的神经语言模型多卡训练分析

与本文相关的学术论文