基于深度强化学习多用户移动边缘计算轻量任务卸载优化

来源 :测试科学与仪器 | 被引量 : 0次 | 上传用户:studentOfJXUFE
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动边缘计算(MEC)在提高移动设备的计算体验质量方面具有一定的应用前景.它可以为支持传统通信和MEC服务的切片式无线接入网提供紧密邻近的计算功能.然而,这种密集计算问题是一种高维的NP难问题,一些机器学习方法在解决该问题的时候不能取得良好的效果.针对这些问题,本文将最佳计算卸载问题建模为马尔可夫决策过程,目标是最大化长期效用性能,从而根据队列状态、能量队列状态以及移动用户与BS之间的信道质量做出卸载决策.为了降低状态空间中高维性的问题,提出了应用深度确定性策略梯度的基于候选网络优化边缘计算优化卸载ECOO算法,从而产生一种用于解决随机任务卸载的新型学习算法.通过仿真实验证明,ECOO算法在能耗和时延方面优于一些深度强化学习算法,在处理高维问题时效果更好.“,”To improve the quality of computation experience for mobile devices,mobile edge computing (MEC)is a promising paradigm by providing computing capabilities in close proximity within a sliced radio access network,which supports both traditional communication and MEC services.However,this kind of intensive computing problem is a high dimensional NP hard problem,and some machine learning methods do not have a good effect on solving this problem.In this paper,the Markov decision process model is established to find the excellent task offloading scheme,which maximizes the long-term utility performance,so as to make the best offloading decision according to the queue state,energy queue state and channel quality between mobile users and BS.In order to explore the curse of high dimension in state space,a candidate network is proposed based on edge computing optimize offloading (ECOO)algorithm with the application of deep deterministic policy gradient algorithm.Through simulation experiments,it is proved that the ECOO algorithm is superior to some deep reinforcement learning algorithms in terms of energy consumption and time delay.So the ECOO is good at dealing with high dimensional problems.
其他文献
光笔式坐标测量系统是一种基于视觉测量的便携式坐标测量技术.在经典的光笔式坐标测量系统中,其测量范围被限制在相机的视场范围之内.为了克服这种缺陷,本文设计了一种新的光笔式坐标测量系统以实现全空间坐标测量.相机被安装在一个转台而不是三脚架上,因而,相机能够进行旋转从而对光笔的移动进行跟踪.新系统能够被用于大范围的工业现场测量,因此极大地扩展了光笔式坐标测量系统的应用范围.为了保证新设计系统的测量精度,本文还提出了一种对跟踪转台参数进行标定的方法.将光笔放置在固定的位置,并改变转台两个旋转轴的方位角,让相机从不
多均值聚类算法假设每个类拥有多个子类,通过求解优化问题的方式来求解每个样本子类的划分和最终类簇的划分.该算法弥补了K-均值算法在非球数据集上的劣势,取得了较好的聚类效果,但是该算法无法被运用到多视图数据集上.本文提出了一种多视图K-多均值聚类算法,保留了K-多均值设置多个子类的设计,引入了视图权重参数,将目标聚类数作为限制条件,通过求解最优问题获得最终的类簇.将本文提出的算法与流行的多视图聚类算法进行对比实验,证明了本文算法的优越性.“,”The K-multiple-means (KMM)retains
利用FRTA爆炸极限仪测定了M15甲醇-汽油混合物的爆炸特性.通过试验研究了温度对M15甲醇-汽油混合物爆炸范围的影响.研究结果表明,在初始温度为80℃时,M15甲醇-汽油混合物的爆炸下限为1.716%,爆炸上限为11.451%.当温度变化范围为25℃-100℃时,M15甲醇-汽油混合物的爆炸下限范围为1.711%-1.760%,爆炸上限的范围为11.253%-11.451%.基于合理的试验误差可知,温度对M15甲醇-汽油混合物的爆炸范围影响较小.“,”The explosion characterist
在自动驾驶技术研究中,理解道路场景是提高驾驶安全性的保障.语义分割技术可以在像素级别上,将图片分割成与语义类别相关联的不同图像区域,可以辅助车辆感知、理解周围的道路环境信息,从而提高驾驶安全性.当下流行的语义分割模型Deeplabv3+在分割任务中,存在细小目标被漏分割以及外形相似物体容易被误判等现象,导致分割边界粗糙,精准度降低.针对此问题,在Deeplabv3+网络结构的基础上,结合注意力机制加重分割区域的权重,提出一种改进的Deeplabv3+融合注意力机制的道路场景语义分割方法.首先,在Deepl
深水海域水下设施的安装过程中,姿态调节是一个关键环节.为解决这一问题,研发一种应用于深水的万向水平仪.对水平仪的密封原理及深水耐压原理进行了分析;对螺纹联接强度进行了校核;通过力学仿真验证了水平仪可以耐受2000 m水深的压力,在20 MPa高压舱内进行了30 min水压测试.实验完成后,水平仪外观完好、无泄漏情况.实验表明,深水万向水平仪可以被应用于2000 m内的深海.“,”Attitude adjustment is a key link in the installation process of
针对传统的单幅图像去雾算法容易受到雾图先验知识制约导致颜色失真等问题,本文提出了一种基于HSI颜色空间的深度学习多尺度卷积神经网络单幅图像去雾方法,即通过设计深度学习网络结构来直接学习雾天图像与其无雾清晰图像色调、饱和度和亮度之间的映射关系,从而实现图像去雾.该方法首先将有雾图像从RGB颜色空间转换到HSI颜色空间,然后设计了一个端到端的多尺度全卷积神经网络模型,通过色调H、饱和度I、强度S三个不同的去雾子网分别进行多尺度提取,深度学习得到有雾图像与清晰图像之间的映射关系,从而恢复出无雾图像.实验结果表明
针对电动汽车中永磁同步电机传统控制策略对电机控制性能差的问题,提出了一种新型的自适应非奇异快速终端滑模模型预测转矩控制策略.设计了新型自适应指数趋近率,用性质更佳的双曲正切函数tanh()替换传统的切换函数sgn(),并构造了带ESO扰动观测的新型ANFTSMC作为系统转速控制器,消弱了抖振,提高了系统鲁棒性.为实现调速系统的无传感器控制,构造了基于tanh(Fal)的ESO转速观测器.与传统基于Fal函数的ESO相比,观测误差较小,观测精度较高.同时,针对预测转矩控制策略,提出了新型的目标函数构造方法,
针对传统带有滑模观测器的永磁同步电机控制系统中转矩脉动大、抖振明显、反电动势估计精度差等问题,提出基于模糊滑模控制和两级滤波滑模观测器的PMSM改进控制策略.首先,在速度环提出基于双曲正弦函数的新型趋近率,结合模糊控制思想对趋近率参数实现自整定,设计了一种基于新型趋近率的模糊积分滑模速度环控制器,并且对新型趋近率的抖振抑制效果给出严格分析.其次,提出基于变截止频率低通滤波器和修正反电动势观测器的两级滤波结构,抑制反电动势中的高频分量和测量噪声,并对转子位置进行合理补偿,继而设计了两级滤波滑模观测器;通过L
非平稳及多奇异点的调频料位测量雷达回波中包含虚假回波及噪声,影响料位回波信号检测,导致料位测量精度不高.本文提出了一种基于广义S变换和奇异值分解的料位回波检测与校正方法.首先,将料位变化视作低速运动目标,将料位回波信号与雷达发射信号进行混频解调,并根据回波信号的频率分布特点对广义S变换窗口的变化趋势进行调节.之后对其变换所得到的二维时频系数矩阵利用奇异值分解方法重构系数矩阵,并对其进行广义S逆变换,得到校正后的回波信号.实验结果表明:该方法能够准确检测料位回波信号,在抑制噪声的同时能最大限度保留信号的细节
核电厂升压站直击雷防护范围确定方法主要有折线法和基于电气几何模型(EGM)的滚球法(以下简称EGM滚球法).本研究在EGM滚球法基础上,利用电磁暂态仿真程序提出了一种改进滚球法.该方法给出的滚球半径考虑了被保护设备附近避雷器配置、避雷器残压与设备绝缘水平的配合系数,更符合实际工况,与EGM滚球法计算结算结果相比:滚球半径更大,防护范围更大.比传统的折线法更合理地考虑了系统的绝缘水平和雷电侧击的情况,为变电站直击雷防护提供了新的设计思路.