异构分布式机器学习任务的在线调度问题研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:wu000mengya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,机器学习已成为必不可少的数据分析技术,该技术可从大规模数据集中获取有用的信息。传统机器学习在单个机器上训练和处理数据。随着大数据时代的到来,单个机器无法满足机器学习任务庞大的存储和计算需求。于是,分布式机器学习应运而生。机器学习庞大的训练数据集和复杂的训练模型被划分为多个部分分布式地部署在多台机器上,并发地训练数据。大多数领先的IT公司都部署和维护着基于GPU服务器的分布式机器学习集群。分布式机器学习任务是非常消耗时间和资源的。那么对于服务提供商来说,最小化分布式机器学习系统中任务的平均完成时间是非常必要的。分布式机器学习任务通常具有资源需求弹性,其特征是当一个任务采用不同资源配置和数量的工作节点训练数据时,所需要的完成时间不同。对于单个任务来说,为其分配最佳配置的工作节点训练速度最快。但从分布式机器学习系统全局考虑,以最优配置运行每一个任务并不是最佳的解决方案。于是,分布式机器学习集群中的一个基本问题是如何探索机器学习任务的资源需求弹性并为每个任务采用不同的资源配置进行调度,从而最大程度地利用资源并最小化任务的平均完成时间。
  本文以分布式机器学习任务为研究对象,以分布式机器学习任务的资源需求弹性为切入点,以最小化分布式机器学习系统中的任务平均完成时间为目的,基于参数服务器架构和Ring-AllReduce架构,开展任务调度算法设计研究。本文提出了一种在线调度算法,用以在每个任务到达时确定任务执行窗口,并发工作结点(和参数服务器结点)的数量和资源配置,从而最大程度地减小任务平均完成时间。本文提出的在线算法包括:一个在线调度框架,该框架采用迭代的方式将未处理的机器学习任务分批,从而将平均完成时间最小化问题分解为一系列的批处理调度问题;以及批处理调度算法,该算法为每一个机器学习任务配置资源以最大化当前迭代中已调度作业的总权重。
  本文通过严谨的理论分析证明了本文提出的在线算法具有良好的参数化竞争比率,并且具有多项式时间复杂性。本文选取了三种在现今的分布式机器学习系统中具有代表性的调度策略来进行对比实验。在模拟实验中,本文以实际数据作为该在线算法的输入,从输出目标函数值和运行时间两个方面对算法进行分析评估。最终的实验结果表明本文提出的在线调度算法比当今云系统中最先进的调度程序更具优势。
其他文献
本文主要研究基于采样数据的事件驱动系统及其应用。首先基于推广的连续离散分析方法给出了在不同通讯条件下保证事件驱动系统指数稳定的充分条件,而后分别将其应用到一类本质非线性系统的输出反馈控制,一类多输出非线性系统的观测器设计以及多智能体系统分布式优化等问题中。主要工作可以总结如下:  第一章介绍了课题的研究背景。分别说明了事件驱动控制,输出函数未知的非线性系统镇定问题,非线性观测器设计及分布式优化与控
四旋翼飞行器是一种结构简单、体积较小、易于操控、能够垂直起降的无人航空器,它凭借着这些优点被广泛应用于民用和军事领域。四旋翼无人机能够稳定飞行需要依靠它的飞行控制系统,因此对飞控系统的研究具有重要意义。对于这个欠驱动、多变量、强耦合的非线性系统,可能还会受到各种环境因素的影响,提高四旋翼控制系统的稳定性、鲁棒性和抗扰性是很有必要的。本文基于自抗扰控制技术,设计了四旋翼姿态和位置的自抗扰控制器,实现
中医在我国医疗体系处于重要地位,几千年来为民族繁荣和人民健康做出了巨大贡献,特别在最近的新冠疫情(COVID-19)中,中医诊疗技术发挥了重要作用。在“人工智能+”的大背景下,智能中医技术的研究能为中医打开智能化发展的新格局。中医知识体系庞大且错综复杂,医师严重依赖大量临床经验。将中医知识库融合多源体征信息,嵌入中医领域知识,再进行全过程高效、客观的健康管理是智能中医研发的必然趋势。  本文的研究
学位
本文探讨了生命科学领域的一个热点问题—-疾病标志物识别,并且采用计算机科学领域网络分析方法解决该问题,这种交叉研究使其在理论和应用层面上都具有巨大的研究价值和科学意义。生物体是存储并加工信息的复杂系统,而该系统的核心是其组成成分准确地行使各自的功能并且相互协调合作,疾病的产生和发展往往是分子之间调控机制异常导致的,因此,设计有效的数学分析方法发现疾病相关的分子调控机理(疾病标志物),对疾病深入了解
视图合成作为计算机视觉领域的一项热门的研究,在虚拟现实、场景三维展示、2D视频转3D视频等领域应用广泛,为传统的图像和视频媒体提供了更为生动的信息展示方式。作为其中的关键性技术,深度估计为视图合成提供了场景的几何信息和从已知视图中采样的依据,其质量直接决定了视图合成的效果。  传统的基于多视图立体几何的深度估计方法依赖于特征点匹配算法,在真实世界中复杂的自然场景下拍摄的图片经常会出现光照不一致或者
学位
随着互联网和移动通信技术的不断发展,我们所面临的信息过载问题也日益严重,而文本自动摘要技术作为有效解决该问题的方法之一,一直以来都是自然语言处理领域的研究热点。目前,语音识别和自然语言处理联系紧密,而经过语音识别系统输出的文本也会面临各种各样的自然语言处理任务。因此,本文研究一种语音识别场景下的生成式短文本自动摘要方法,以探究文本自动摘要技术在复杂场景下的可行性。  本论文的研究内容分为了两部分:
随着互联网的快速发展,Web服务器的安全问题也愈发重要。网络攻击行为的层出不穷使得构建Web服务器入侵检测系统迫在眉睫。用于Web服务器入侵检测中的免疫算法目前主要有树突状细胞算法和反向选择算法两种。前者虽然能检测到未知类型的入侵行为,但信号提取的不准确性导致了误报率较高;后者是一种单类学习算法,对训练过的入侵类型检测结果较好,但无法检测出未知类型的入侵行为。  上述两种免疫算法存在的问题与其模拟
学位
心血管疾病(cardiovascular disease,CVD)一直是人类健康的首要威胁。目前临床上,医生通常使用心电图(electrocardiogram,ECG)进行诊断。与此同时判断心电图是否异常是一项非常专业的工作,因此需要具有丰富理论知识和丰富临床经验的医生,但是目前心血管疾病医生数量不足且工作强度大。因此,开发快速,准确的算法十分重要。尽管目前已经提出了很多自动判别心电图的算法,但是
学位