基于多智能体强化学习的无人机群协同搜索研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:fever1879
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集群搜索和区域覆盖问题在军事侦察、蜂群打击、智慧植保、环境勘探等方面有着广泛的应用,在军用和民用领域被广泛研究。现有区域搜索和覆盖算法所规划的路径具有很强的规律性,没有充分考虑集群的动态变化和环境态势的发展,因而无法获得多约束条件和存在突发事件下的最优解。本文以无人机群搜索问题为研究课题,重点研究基于深度强化学习的无人机群搜索算法。主要研究内容有以下方面。梳理了从马尔可夫过程到多智能体强化学习值分解问题的发展历程,指出现有基于强化学习的集群搜索算法研究多以单智能体演化算法为主,缺乏基于值分解问题的最新方法。因而都不可应用于分布式的决策环境中。为了平滑地从单智能体算法向多智能体算法过渡,本文首先提出了基于序列决策的集群搜索方案。在回报函数设计、环境探索设计方面进行了充分的思考,巧妙利用状态空间在时间域的歧义性问题实现不同智能体间的样本互用,打破回报函数设计与任务目标呈正相关或负相关的思维定势,并通过仿真对比验证了改进方案的收敛稳定性及效果更优。在基于序列决策的集群搜索方案的基础上,本文进一步提出了基于分布式决策的无人机群搜索方案。详细阐述了两者在环境建模方面的区别。从算法层面通过图文结合的方式详细论证了现有非单调性值分解算法学习速度慢的原因,并提出了快速值分解算法。通过仿真试验证实了该集群搜索问题属于非单调性值分解问题,且新提出的算法比现有非单调性值分解算法有着更快的学习速度。最后本文设计了一个基于机器人操作系统和无线路由通信的无人机群实物验证平台,基于该系统给出了无人机群协同搜索的软件在环验证及实物飞行验证,进一步证实了基于序列决策的无人机群搜索方案的可行性及算法优越性。
其他文献
通过酯交换法以蔗糖为原料合成了一种具有高反应活性的多官能度蔗糖型乙酰乙酯(SA),采用红外光谱和核磁共振波谱对SA的结构进行了表征。以聚醚胺D230和异佛尔酮二胺为复合固化剂,并对其固化过程进行红外监测。采用拉伸测试、动态机械热分析(DMA)、热重分析(TGA)等手段对SA-DA树脂的性能进行了表征,通过拉曼光谱对碳纤维的回收效果进行了分析。结果表明:SA-DA树脂具有良好的拉伸性能,玻璃化转变温
学位
在当前世界工业物联网的背景下,现代信息技术不断延伸出巨大的社会功能,“智慧城市”逐渐成为了世界智能化、便捷化发展的新方向。其中,水务领域具有不可或缺性,智慧水务的普及俨然成为了智慧城市发展领域的新趋势。为此,本文基于数据分析和监测展开对智慧水务系统的设计与研究,并建立了优化调度模型。在研究过程中,需要通过水量监测等环节有效地平衡二次供水的压力和扬程,实现智慧水务平台的开发,保障智慧水务系统在城镇供
随着质量强国战略的提出,如何建设高质量的产品、服务、城市和工程等成为我国发展的重要议题,其中建设高质量的数字化城市是我国目前城市发展的重要途径。在我国十四五规划中,有关部门也提出了相应的城镇化战略,以提升我国城市发展水平。但是目前就我国的城市发展来看,我国城市发展不平衡,空间发展不一致。所以针对此类问题,建设智慧城市成为了我国高质量城市发展的重要手段。随着智慧城市的发展,对于智慧城市评价的研究也在
随着我国对海岛的不断建设,海岛的资源、渔业、旅游、军事等各方面的发展也越发壮大,对安全、可靠、清洁的能源与淡水资源的需求也越来越大。目前海岛上供能成本较高,并且“垃圾围城”等问题对岛上环境有较大的破坏,极大限制了海岛的建设与发展。在“推动绿色低碳发展,持续改善环境质量”的政策号召下,建立可以充分利用海岛的可再生能源来进行各种能源和资源的供给、有效保护和改善海岛环境的环境友好型海岛多能源系统成为了有
学位
进入21世纪以来,社会经济高度发展,居民生活不断提高,各行各业对于电力能源的需求量不断增加,电力能源已成为社会发展及居民生活的必需品,为保护生态环境,国家大力发展清洁能源提出了实现“碳达峰”、“碳中和”的目标。如何高效建设坚强智能电网、不断提高供电可靠性及供电质量、做到客户满意成为电力企业的面临的大问题,解决所有问题的关键在于高速推进输变电工程落地,新增电源布点,新建输电线路。输变电工程建设较建筑
学位
在市场经济体制不断完善和发展的背景下,具有计划、控制、评价等功能的全面预算管理已经发展成为提升企业竞争力的科学管理工具。近年来,随着经济的高质量发展,企业间的竞争越来越激烈,投资者的关注点也由利润相关指标转变为企业长期发展能力指标。基于此,现代企业也越来越看重全面预算管理工具,试图通过实施全面预算管理优化企业资源配置,以提升企业价值,最终实现公司长远、高质量发展的目标。但现有传统的全面预算管理方法
电驱动机械臂广泛应用于搬运、焊接、钣金折弯、医疗等领域。其由关节伺服系统进行驱动,实现机械臂的运行。然而关节处由于柔性环节的存在导致系统存在振动现象,严重影响了位置控制精度。本文针对机械臂关节柔性带来的机械振动问题进行了研究。分析了柔性关节机械臂垂直运动和水平运动时负载转矩变化规律,建立了考虑变刚度系数和大减速比的柔性关节机械臂伺服系统数学模型,通过系统控制框图和传递函数,采用频域分析法和机电等效