强化学习方法在通信拒止战场仿真环境中多无人机目标搜寻问题上的适用性研究

来源 :中国科学:信息科学 | 被引量 : 0次 | 上传用户:wt920997920
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标搜索问题是现实中一类常见的问题,如灾难现场搜救、战场目标侦察等.无人机由于其灵活性、低成本、可搭载各类传感器并以集群形式开展协作等优势,是解决大范围、高风险区域目标搜索问题的理想技术方案,当前发展迅速.在战场等复杂现实环境中,由于缺乏基础通信设施及干扰的存在,无人机与地面指挥员、无人机之间难以快速、可靠通信,处于通信拒止状态.因此,无人机难以获得指挥员的实时控制信息,需要其具备自主、智能完成任务的能力并开展协同.随着人工智能技术的快速发展,强化学习技术在解决连续决策问题上展现出了较强的潜力.无人机搜索问题作为一种典型的连续决策问题,属于强化学习技术的适用范围.但对于目前的强化学习及人工智能技术能否适用于无人机从而自主决策完成现实场景中的任务这一问题尚存争议,仍有待进一步探索.为此,本文以现实战场环境为背景,对通信拒止及包含两方对抗的战场环境中的目标搜寻问题进行了建模,依据模型构建了对抗仿真平台,并通过实验研究的方式针对以下3个问题展开了探索:(1)强化学习在通信拒止环境下多无人机搜索问题的适用性;(2)各强化学习算法在该问题上的优劣;(3)通信拒止程度对强化学习算法效果的影响.通过运用当前主流的强化学习技术开展仿真实验并定量评估实验结果.本文总结发现:(1)强化学习在解决通信拒止环境下多无人机搜索问题上具备有效性;(2)在与其他算法对抗时,运用基于Deep Q-Network (DQN)强化学习技术的自主决策无人机集群体现出了较强的问题解决能力;(3)通信拒止程度对强化学习算法效果有影响,但在不同的通信拒止程度下,强化学习算法表现相对稳定.
其他文献
北京的街巷纵横交错,数量繁多。老北京人常说:“有名的大街三百六,无名的胡同赛牛毛。”在数以万计的街巷地名中,尤以寺庙命名,或因寺庙演化而来的地名独具特色。这些地名历史久远
二十一世纪的今天,各类媒体竞争加剧,新兴媒体不断涌现。广播事业作为我国发展最早的、也是最传统的一项媒体事业是社会主义农村建设的重要组成部分,它影响着农村文化的发展
原创舞剧《永不消逝的电波》传承红色文化基因,选取了一个经典的谍战故事,歌颂了一位年轻执著的我党潜伏英雄,是现代红色革命主题文化在当代的成功艺术表达,在强烈的主旋律命题中
报纸
目的从家蝇三龄幼虫中提取总RNA,先利用RT-PCR扩增编码天蚕素Cecropin的cDNA序列,克隆入T载体pUCm-T并测定其序列。然后以pUCm-T/Cecropin为模板,通过PCR方法扩增Cecropin成
不同的企业在各自实践中逐步培育成不同的文化,它是这个企业的灵魂。无论是企业的决策人员、管理人员,还是基层的工作人员,都必须受到企业文化的制约。也就是说,没有企业文化就谈
手风琴伴奏教学是高师手风琴教学的重要环节。由于这一课程开设时间短、教学内容多,一些教师将重点放在培养学生的独奏能力上,而忽视了伴奏能力的培养。因此,文章提出高师手
体胚发生率低是制约海岛棉体细胞胚发生体系应用的瓶颈之一.为提高体细胞胚胎发生率,本研究以新疆海岛棉品种XH16胚性愈伤为实验材料,从植物凝胶、培养基pH值、氨基酸含量、
盾构选型是盾构隧道施工的关键技术,合理的选型能为后续顺利施工奠定基础。以特拉维夫红线轻轨工程为背景,通过对土层进行试验分析,在充分考虑富水库卡地层土层特性和隧道线
针对集成电路所需测试数据量庞大、测试成本过高的问题,该文提出了最小游程切换点标记编码压缩方法,将原始测试数据压缩,达到减少测试成本的目的。该方法将测试集按若干向量
目的:报告腹腔镜辅助联合肝脏离断和门静脉结扎的二步肝切除术(ALPPS),用于治疗因剩余肝体积不足无法行一期根治性肝切除手术的原发或转移性肝肿瘤,3D打印技术为ALPPS术前规划提