基于联邦深度强化学习的车联网资源分配

来源 :电子测量技术 | 被引量 : 0次 | 上传用户:adunisrunning
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
车辆通信(V2X)能够有效地提高交通安全性和移动性,是车辆部署场景中的关键技术之一.V2X通信链路需要满足不同应用的服务质量(QoS)要求,如车对车(V2V)链路的延迟和可靠性要求.面向车辆高速移动性导致的无线信道快速变化,为保证不同车辆链路的QoS约束和车辆动态网络的鲁棒性,提出一种基于联邦深度强化学习(FDRL)的频谱分配和功率控制联合优化框架.框架首先根据不同车辆链路需求提出了对应的优化问题,并定义了强化学习的状态空间、动作空间和奖励函数;然后介绍了联邦深度强化学习的训练框架;最后,通过分布式的车辆端强化学习和基站聚合平均训练,找到最佳的频谱分配和功率控制策略.仿真结果表明,与其他对比算法相比,所提出算法能够提高车对基站(V21)的总用户信道容量,并保证了新加入车辆时动态网络的鲁棒性.
其他文献
针对复合绝缘子安全运行需要,进行复合绝缘子脱粘缺陷相邻电容无损检测方法研究。通过数值仿真和实验,研究了相邻电容传感技术对多层介电结构脱粘缺陷检测的可行性及电极宽度和间距对相邻电容传感器检测能力的影响。结果表明,相邻电容传感技术可用于多层介电结构界面脱粘缺陷检测,且电极宽度和电极间距对其检测性能有影响,通过优选电极参数可以提高相邻电容检测技术的检测效率和分辨率。该研究工作为复合绝缘子芯棒脱粘检测提供了可行的技术方案。
为了提高PID控制器对系统的稳定性,并减少控制误差,提出一种自适应神经网络PID控制器。首先,在离散时间模型中开发PID控制器,以减少在连续时间中设计控制器所带来的问题。然后,定义一个自适应神经网络,调整控制增益,以实现导航任务过程中六旋翼无人机(UAV)的跟踪误差最小化。利用梯度下降方法对PID控制器的重要参数进行整定。此外,通过卡尔曼滤波对传感器测量值进行过滤,以提高在线自适应的性能。实验结果
对于催化材料,纳米颗粒的大小和形状等结构信息对催化性能有着重要的影响,基于透射电子显微镜图像的纳米颗粒识别与统计是获取这些信息的主要手段。本文提出一种基于深度学习的深度可分离卷积U-Net网络架构,以核壳结构纳米材料为数据集,采用交叉熵损失函数、加权交叉熵损失函数、IoU损失函数和Dice损失函数作为优化目标,分别对网络进行训练。分割结果表明IoU损失函数和Dice损失函数在正负样本不均衡的核壳结