基于DQN的反舰导弹火力分配方法研究

来源 :导航定位与授时 | 被引量 : 0次 | 上传用户:gr123abc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
反舰导弹作为海上作战的主战武器,由于其精度高、射程远、威力大等特性长期以来一直被当作舰艇编队的主要防御对象。针对反舰导弹打击舰艇编队的火力分配问题,我们提出了一种基于深度Q值网络求解反舰导弹火力分配策略的算法。不同于现有的基于领域知识的方法,深度Q值网络无需依赖任何先验信息,就能够通过与模拟器的交互自动求解最佳的攻击策略。该算法使用深度神经网络拟合Q值函数,解决了传统强化学习中的状态空间过大无法遍历的问题。实验结果表明,在各种不同的舰队防御配置下,深度Q值网络求解得到的攻击策略均获得了最佳的毁伤效果。
其他文献
加强职业培训、保障职业教育的未来是德国联邦教育与科研部(BMBF)本届任期内的重要任务之一。德国联邦教研部希望通过“职业机会”的概念来改善职业教育的整合力、吸引力与透明度。  近日,来自德国政治、经济、工会和科学界的500多位专家学者齐聚柏林,在工作会议中围绕“职业机会”主题探讨职业教育的现状与未来。  德国联邦教研部部长约翰娜·婉卡在开幕致辞中明确表示要加强职业教育。她说:“职业教育历来是德国教
为验证GNSS旁瓣信号对中高轨航天器在轨飞行的导航支持能力,“嫦娥5号”飞行试验器搭载了GPS导航接收机。由于目前使用的星载导航解平稳性不够,为此,根据月球探测器不同飞行
针对传统的无线定位方法容易受到接收信号信噪比低和无法接收直射信号的影响,将导致其性能下降乃至严重时方法失效。提出了一种基于非线性多基站分布式混沌随机共振信号增强
针对单一模型滤波器在未知或不确定的系统参数下适应性较差的问题,提出了一种新的基于多模型自适应估计(multiple model adaptive estimation,MMAE)的滤波方法.该方法利用改进
针对卫星导航所需的高精度地球定向参数(EOP)中的UT1-UTC预报问题,提出了基于双差分LS+AR的UT1-UTC参数预报方法。对UT1-UTC观测数据进行跳秒检测、固体地球带谐潮汐项改正,然后对改正后的UT1-UTC数据进行双差分处理,增强数据平稳性;采用最小二乘拟合(LS)与自回归(AR)分析方法对差分处理后的数据进行分析与预报;对预报结果进行逆差分处理与潮汐项改正外推、跳秒恢复,获取高精度
广州市社会主义学院保持共产党员先进性教育活动分学习动员、分析评议、整改提高三个阶段进行.在整个过程中,紧紧抓住学习实践"三个代表"重要思想主线,树立和落实科学发展观,
以小天体伴飞附着任务为工程背景,针对探测器在小天体复杂弱引力场条件下附着这一难题,研究了最优制导控制策略。首先,考虑在小天体极区实施附着任务,建立并简化动力学模型,
提出采用面向动态连接的光纤激光相控阵的深空激光通信及全光组网技术,对4-35万千米深空探测链路功率进行了仿真,由于1.55μm 掺铒光纤放大器的饱和输出限制,使其安全裕量大
CE-3号探测器于2013年12月14日成功着陆于月表虹湾区,在预期1年的生存期内,着陆器能够相干转发下行X波段信号.基于这些信号,地面测控天线以及VLBI(very long baseline interfe
5G移动通信系统中,设备到设备的通信方式产生了节点间的信号测量,可用于提升无线定位的覆盖范围和定位精度。提出了一种基于最小约束系统的分布式协作定位方法,该方法首先利