基于联邦深度强化学习的车联网资源分配

来源 :电子测量技术 | 被引量 : 0次 | 上传用户:adunisrunning
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
车辆通信(V2X)能够有效地提高交通安全性和移动性,是车辆部署场景中的关键技术之一.V2X通信链路需要满足不同应用的服务质量(QoS)要求,如车对车(V2V)链路的延迟和可靠性要求.面向车辆高速移动性导致的无线信道快速变化,为保证不同车辆链路的QoS约束和车辆动态网络的鲁棒性,提出一种基于联邦深度强化学习(FDRL)的频谱分配和功率控制联合优化框架.框架首先根据不同车辆链路需求提出了对应的优化问题,并定义了强化学习的状态空间、动作空间和奖励函数;然后介绍了联邦深度强化学习的训练框架;最后,通过分布式的车辆端强化学习和基站聚合平均训练,找到最佳的频谱分配和功率控制策略.仿真结果表明,与其他对比算法相比,所提出算法能够提高车对基站(V21)的总用户信道容量,并保证了新加入车辆时动态网络的鲁棒性.
其他文献
为了提高手语识别准确率,提出一种基于混合粒子群优化的支持向量机(HPSO-SVM)的多传感器手语识别方法.在原始数据采集阶段,利用ZTEMG-2000肌电传感器采集人体手臂表肌电信号
针对传统校正方法在非均匀背景场中会面临校正性能降低,甚至完全失效的问题,设计了一种新的非均匀背景场中的矢量磁力计阵列校正方法,依据空间中一点的张量不变量的旋转不变
针对未知动态环境中多机器人协作围捕的时间长、成功率低的问题,提出了一种基于生物启发神经网络的新型多机器人协作围捕方法.首先,构建了多机器人协作围捕模型,利用动态联盟
针对当前无线传感器网络(WSN)级联模型中流量指标无法正确反映WSN的汇聚特征,提出了一种受节点容量和链路容量限制的无线传感器网络级联模型.首先,在每个节点上根据新的度量
传统的单个模糊分类器方法采用固定的去模糊化规则,在情感数据分类上容易引起文本歧义,针对该问题,提出一种基于深度神经网络和模糊规则的文本分类方法.该方法分为两个主要阶
针对复合绝缘子安全运行需要,进行复合绝缘子脱粘缺陷相邻电容无损检测方法研究。通过数值仿真和实验,研究了相邻电容传感技术对多层介电结构脱粘缺陷检测的可行性及电极宽度和间距对相邻电容传感器检测能力的影响。结果表明,相邻电容传感技术可用于多层介电结构界面脱粘缺陷检测,且电极宽度和电极间距对其检测性能有影响,通过优选电极参数可以提高相邻电容检测技术的检测效率和分辨率。该研究工作为复合绝缘子芯棒脱粘检测提供了可行的技术方案。
为了提高PID控制器对系统的稳定性,并减少控制误差,提出一种自适应神经网络PID控制器。首先,在离散时间模型中开发PID控制器,以减少在连续时间中设计控制器所带来的问题。然后,定义一个自适应神经网络,调整控制增益,以实现导航任务过程中六旋翼无人机(UAV)的跟踪误差最小化。利用梯度下降方法对PID控制器的重要参数进行整定。此外,通过卡尔曼滤波对传感器测量值进行过滤,以提高在线自适应的性能。实验结果
在计算机系统电磁辐射的信息泄漏中,视频信号是最容易被截获及恢复的信息.针对计算机系统VGA线缆传导发射的视频信号的恢复问题,建立了计算机模拟视频信号在VGA传输通道中的
随着信息化程度不断加深,移动机器人的应用越来越广泛,但在很多情况下,移动机器人需要工作在不断变化且复杂的环境中,由于无法提前获取环境信息,往往难以对移动机器人进行路
对于催化材料,纳米颗粒的大小和形状等结构信息对催化性能有着重要的影响,基于透射电子显微镜图像的纳米颗粒识别与统计是获取这些信息的主要手段。本文提出一种基于深度学习的深度可分离卷积U-Net网络架构,以核壳结构纳米材料为数据集,采用交叉熵损失函数、加权交叉熵损失函数、IoU损失函数和Dice损失函数作为优化目标,分别对网络进行训练。分割结果表明IoU损失函数和Dice损失函数在正负样本不均衡的核壳结