论文部分内容阅读
移动边缘计算(Mobile Edge Computing,MEC)致力于为移动网络边缘提供运营商级服务环境和云计算能力,以减少任务的传输时延,并提升用户的体验质量(Quality of Experience,Qo E)满意度。但移动网络边缘的计算资源有限,随着任务需求的多样化和应用场景的复杂化,MEC将面临以下挑战:1)任务数据的实时性和移动设备的能耗在MEC计算和无线资源受限的情况下难以折中;2)边缘网络流量的非线性和核心网拓扑的复杂性使得网络带宽利用率不高;3)动态的任务密度分布造成热点小区边缘服务器计算能力与移动设备计算需求不匹配。针对上述问题,本文结合软件定义网络(Softwaredefined Networking,SDN)和MEC技术,设计了基于SDN的轻量级MEC网络系统架构。论文具体研究要点和研究成果描述如下:(1)基于SDN的MEC中网络流量预测方法。在基于SDN的MEC网络中,流量预测不仅能给网络管理者提供科学依据来预测节点拥塞,还可以给网络流提供适当的路径并提高网络资源的利用率。第二章采用GA-LSTM(Genetic Algorithm-Long Short Term Memory network)优化模型进行流量预测。首先,利用LSTM对网络中的流量进行时域特征提取。其次,采用遗传算法(Genetic Algorithm,GA)来优化LSTM网络的超参数。最后,建立GA-LSTM的网络流量预测模型。研究基于雅虎数据中心-Dallas的网络流数据集,实验结果表明GA-LSTM模型较ARIMA、LSTM两种方法,预测准确度得到了显著提升。(2)MEC中计算卸载和资源分配联合优化(Joint Optimization of Computation Offloading and Resource Allocation,JCORA)。第三章内容考虑MEC中单边缘服务器场景,研究动态环境(如无线信道和任务到达随着时间变化)下的JCORA问题,该问题可被描述为一个马尔可夫决策过程。本章基于深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)框架,设计时域注意力确定性策略梯度(Temporal Attentional Deterministic Policy Gradient,TADPG)智能体,TADPG具有两个显著特征:1)设计了由一维卷积残差块和注意力长短期记忆网络组成的时域特征提取网络,该网络可以有效地对输入的状态信息进行时域相关性特征提取,2)为了加速和稳定模型训练的收敛效果,设计了一种基于排序的经验优先回放方法来减少训练时间。仿真结果表明,所提TADPG算法模型具有良好的收敛能力。基于分布式TADPG机制下JCORA性能优于基于集中式TADPG机制下的JCORA性能,并且在任务完成时间和能耗上均优于目前最先进的DRL(Deep Reinforcement Learning)方法。(3)SDN路由与资源分配联合优化(Joint Optimization of Routing and Resource Allocation,JRRA)。第四章内容考虑链路带宽约束下,研究SDN动态JRRA的控制机制。SDN控制器在全局视角的基础上合理规划网络路径并对全网所有源目的节点进行流表预配置,以满足用户低时延需求。本章把SDN动态JRRA问题看作为一种集中决策问题,提出了一种轻量级SDN动态路由优化框架,即时空确定性策略梯度(SpatioTemporal Deterministic Policy Gradient,STDPG)智能体。Actor和Critic网络都基于相同的DNN(Deep Neural Network)结构,即CNN-LSTM-TAM。通过有效地利用时间和空间维度上的特征,CNN-LSTM-TAM有助于STDPG智能体更好地从经验样本中学习。此外,采用了优先经验重放方法来加速模型训练的收敛。仿真结果表明,基于STDPG的SDN路由与资源分配联合优化方法可以实时地自适应当前网络环境,具有良好的鲁棒性和有效性。与几种先进的DRL方法相比,STDPG在平均端到端延迟方面实现了更好的路由解决方案。(4)基于SDN的MEC中多跳协同计算卸载和资源分配研究。在运营商更加宏观的网络视角来看,有些非热点小区的MEC服务器仍有剩余的资源未被利用。为了优化MEC边缘服务器资源的使用和防止MEC边缘服务器过载,那么通过移动核心网将多个小区的边缘服务器彼此连接是合理且经济的。第五章构建了一种基于SDN的MEC中多跳协同计算卸载和资源分配模型,所有边缘服务器通过基于SDN的核心网相连接,为了满足任务请求,任务不仅可以卸载到本小区的边缘服务器,还可以通过核心网转发到一个适合的边缘服务器上执行。考虑到高度动态的边缘服务器资源和负载,为了实现任务高效协同调度,资源全局优化配置,设计了基于DRL的负载均衡(Deep Reinforcement Learning Load Balancing,DRLLB)优化算法,通过联合优化任务是否卸载、边缘服务器选择、任务路由路径和链路传输速率,进行负载均衡决策。仿真结果表明,通过高链路带宽和低链路带宽两种场景的对比,所设计的DRLLB智能体可以在任务执行时间约束的情况下,有效的均衡网络负载,提升链路带宽的最大利用率。验证了DRLLB方案能获得较好的系统性能。