稀疏奖励下多航天器规避决策自学习仿真

来源 :系统仿真学报 | 被引量 : 0次 | 上传用户:xjjxffxxff
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高航天器编队对多拦截器规避能力,针对传统程序式机动规避成功率低的问题,提出一种基于深度强化学习的多智能体协同自主规避决策方法。其中基于Actor-Critic架构设计了一种多智能体强化学习算法,为解决该自学习算法信度分配问题,提出加权线性拟合方法;对于任务场景稀疏奖励问题,提出基于逆值法的稀疏奖励强化学习方法。根据规避任务决策过程建立了空间多智能体对抗仿真系统,利用其验证了所提算法的正确性和有效性。
其他文献
采用高温密炼机和开炼机制备MPU/PAM/CM共混胶,考察了不同DCP用量对共混胶硫化特性、耐油老化前后物理机械性能的影响。研究发现,随着DCP用量的增大,MPU/PAM/CM的硫化速度加快且MH增大;MPU/PAM/CM的物理机械性和耐热介质性能较为优异,共混胶的拉断强度和扯断伸长率均随着DCP用量的增加呈先增大后减小的趋势,大应变下,MPU/PAM/CM共混胶表现出良好的韧性;随着DCP用量的增大,MPU/PAM/CM的扯断永久性变随DCP用量的增大的变化趋势与老化前接近,为30%~40%,较老化前2
斜交农用尼龙外胎加工过程是一个复杂的物理、化学的转变过程,参数的确定、热传导、存放变型等,材料独特性对成品外观质量、使用性能有直接影响。根据多年质量管理经验,从胎胚的预处理、存放、水胎准备方面,探讨提高轮胎质量和硫化工具使用的控制点及方法。
目的:探讨针对临床急诊心梗患者开展优化后急诊护理流程的价值.方法:回顾性分析2018年9月~2020年9月某院急诊收治的79例心梗患者临床资料,甲组40例患者应用常规急诊护理流程(
为解决轮胎成型机胎体帘布层上料的偏移问题,对造成传送带的偏移的因素进行深入分析,将传送带自身的精度和传送带供料架运转造成的偏移两方面原因区分剥离,通过重新建立判断标准,从而实现精准调整,减小上鼓误差,降低劳动强度,提高生产效率。
对我国现行有效的化妆品标准进行整理分析,发现现在的标准体系存在标准交叉、重复的问题,且部分领域存在标准空白的问题.建议开展标准的清理整合,加快新标准的研制,实现标准
目的:探究小儿呼吸科喘息性疾病教学中,CBL-PBL联合教学的应用价值.方法:使用简单随机抽样法从2019年6月至2021年6月于我院小儿呼吸科临床实习的实习生中选取74人,并以摸球法
目的:分析小儿外科临床护理教学中PBL教学模式的应用效果.方法:将2018年7月—2020年7月70名护理专业学生纳入实验中,均开展临床护理教学,以隐匿随机数表法开展分组研究,组别
期刊
为避免或抑制轨道车辆一次蛇行稳定性问题,在分析悬挂参数对轨道车辆蛇行运动模态频率变化规律基础上,选择阻尼比为0与5%分别计算车体一次蛇行运动对应的模态稳定性与悬挂阻尼参数的关系,得到通过优化悬挂参数提高车辆一次蛇行运动稳定性的方法。结果表明,选择不同阻尼比计算车体一次蛇行临界稳定性时阻尼参数范围差异较大;一定区间的横向阻尼或较大的垂向阻尼皆有利于保持车体上心滚摆稳定;过大或过小的垂向阻尼、过小横向
本文主要研究了不同硫化工艺对CR/NBR共混胶热油老化前后力学性能的影响,采用预硫化的方法将CR部分预先硫化一定时间后,然后与NBR共混,研究预硫化对共混胶耐热油老化前后性能的影响。硫化特性实验表明预硫化工艺会降低最大转矩及转矩差值,t10缩短。物理机械性能实验结果表明:预硫化工艺使得共混胶热油老化后拉断强度增大,扯断伸长率增大,老化前后性能保持率提高,综合性能改善。仿真计算结果表明预硫化工艺使得静刚度、应力集中单元处应变能密度及相同节点处Mises应力减小。