基于多智能体深度强化学习的无人机集群自主决策

来源 :信息技术与网络安全 | 被引量 : 0次 | 上传用户:homejang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于传统的无人机由人工进行操控,无人机群在强电磁干扰和复杂多变的战场环境中表现较为呆板。在这项研究中,开发了一种灵活智能的无人机控制器。通过使用一个经过多智能体深度强化学习技术训练的神经网络,无人机可以在飞行中控制自己的行为,从战场环境中获取状态信息,自主决策,并且和其他无人机形成有效战斗队形,灵活协调和配合,并产生了最优的动作。
其他文献
目的:观察葛根芩连汤合大黄牡丹汤加味用于腹腔镜阑尾切除术(LA)后的效果。方法:65例采用随机数字表法分为对照组33例和观察组32例。所有患者均行LA治疗,对照组术后予以常规治疗。结果:治疗后观察组中医证候积分低于对照组(P<0.05),肠鸣音、排气、排便恢复及切口愈合时间短于对照组(P<0.05),C反应蛋白(CRP)、血沉(ESR)、肿瘤坏死因子α(TNF-α)、白介素-6(IL-6)、白细胞
在高职院校就业与创业指导课程教学中运用5E教学模式,充分发挥课程教学的主渠道作用,积极改进教学方法和手段,实施教师引领、学生主导的教学策略,切实提高教学质量。
“五口通商”后,中国建立起以外籍税务司为主的新式海关,征收进出口关税。清廷以关平银为关税征收标准,新式货币银元与关平银的折算成为中外争论的焦点。先后流入中国的银元又有几种不同的形制,新旧洋银在纳税时的补水方案以及官银号的砝码校准等问题,在各地屡起波折。而户部要求征解京饷需用足色库平银,也引起了地方税司和外商的不满。税银折色或征解引起的纠纷或交涉实际也表明英美等国为了便利通商,意欲打破传统中国的关税
长期以来,低保制度在城市反贫困体系中占据着核心地位。随着我国扶贫工作进入相对贫困治理阶段,城市贫困问题凸显,低保制度在城市贫困治理过程中将会遭遇各种困境,包括低保标准与贫困线的衔接、低保群体与城市贫困群体的吻合、救助的外部性和治理的内部性的一致性问题。究其原因,主要是由于治理理念偏差、群体变迁以及社会保障体系缺位所致。面对贫困问题的转型,低保制度应该从突出政策导向、构建多元化标准和完善制度体系三个
减量不减质,是准确贯彻党和政府减轻义务教育作业负担精神的要求。学生心理发展阶段性特征和义务教育教学目标是义务教育作业有效性的重要依据。有效的作业需要具备趣味性、有效反馈性、区分性和探究性,同时教师的及时批改及温情回复能对学生起到正向激励作用。要在“量”“趣”;“练”“诊”;“普”“特”;“用”“究”;“情”“构”上下功夫,提升作业的有效性,增强学生的学习自信心,进而使学生获得更好的作业体验感和学习
目的探讨不同类型幽门螺杆菌(Helicobacter pylori, Hp)感染在慢性胃病中的分布情况及对胃泌素-17(gastrin 17, G-17)、胃蛋白酶原(pepsinogen, PG)的影响。方法 523例慢性胃病患者均行13C尿素呼吸试验、血清Hp抗体分型及血清G-17、PG检测和胃镜检查,根据组织病理学诊断分为非萎缩性胃炎组213例,非萎缩性胃炎伴糜烂组96例,慢性萎缩性胃炎组7
作业的评价应从现代教育和学生的年龄特点出发,强调参与和互动。本文笔者从激励式与提醒式相结合、评语评价与言行评价相结合、评价个体与评价小组相结合、他评评价与自评评价相结合的四种整合评价方式,实现评价的多元化,以"评教"为主转移到以"评学"为主。这样才能充分发挥评价的作用,进而提高学生的语文综合能力。
一、乳油和液剂方法概要将试样在0℃贮存1小时,记录其分离出来的固体物或油状物的体积。继续在0℃贮存7天(原文7小时,疑有误),离心分离,使固体物沉降,记录其体积。仪器冰箱——温度可保持在0±1℃,(注1);圆锥形离心管(图1)——100毫升;离心分离机——可使用规定的离心管;移液管——100毫升。
期刊
针对目前出现的英语作业设计缺乏科学性、纠错效果不佳、时间过长、负担过重等问题,本文提出通过关注作业设计的科学性以及追踪反馈的实效性来实现增效减负的目标,并通过不同类别的作业设计与案例加以解读。
随着防空系统的综合化和智能化,使用多无人机代替有人机执行高风险的压制敌防空(SEAD)作战任务十分重要。针对传统智能优化算法求解任务规划问题存在的低维度、依赖静态、扩展性差等不足,提出一种基于深度强化学习的端到端智能规划方法。以压制敌防空作战任务为对象,将规划过程描述为序贯决策问题,进行马尔科夫决策过程建模,建立基于深度确定性策略梯度算法(DDPG)算法的SEAD智能规划模型并提出通用智能规划架构