基于多Agent强化学习的战时备件供应保障动态协调机制

来源 :空军工程大学学报:自然科学版 | 被引量 : 0次 | 上传用户:luckyxiaoxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
有效的备件供应保障是保证航空装备处于良好状态的重要因素。战时备件供应保障的不确定性特点突出。为了应对这些不确定,精确保障要求下战时备件供应保障更加强调备件资源在系统中的动态协调。鉴于战时备件供应保障系统与多Agent系统的相似性,采用基于Agent的建模仿真技术研究多阶段供应保障过程中的动态协调机制。以Agent之间的供需关系为基础给出了多Agent系统模型结构中小组的定义。为了给出备件短缺情况下使军事效益最大的备件分配策略,设计出以小组为单位的多Agent强化学习方法。最后通过仿真实例验证了方法的有效性
其他文献
采用基于雷诺平均的三维N—S方程和RNGk-ε湍流模型对某型喷管射流注入时的全流场进行了数值模拟,计算结果和试验数据符合良好。为研究射流注入角度对喷管流场的影响,数值模拟
传统不等间距灰色模型UGM(1,1)及其改进型都是基于指数模型建立的,仅对指数变化规律序列有较好的预测精度,而对于常见的线性变化序列则预测误差较大。针对该问题,通过模型拓展,
通过严格证明在Zernike多项式拟合光学干涉波面时,求解拟合系数的2种典型算法即最小二乘法和Gram—Schimdt算法的等价性,论证了求解Zemike多项式拟合系数的各种算法在求解过程
研究导航装备维修用备件需求预测,以便制定保障计划的筹措、分配、储存、调拨、使用等各项工作的顺利进行。通过对季节指数法的详细研究,归纳出该方法的一般步骤,根据某导航
为对空袭目标进行准确选择,达到最大的射击效率,通过把空袭目标的威胁度作为目标函数制定目标选择策略,提出了基于马尔可夫过程的防空武器目标选择策略。首先定义了各个时刻的火
解决由于高速旋转弹丸的旋转特性导致难以采用常规方案对其进行弹道修正的技术难点。提出基于压电陶瓷智能材料的弹道修正原理技术方案,依据弹头可能动作的思路,设计弹头修正
组合导航系统是提高导航系统性能价格比的有效途径,随着信息融合技术的发展,联邦滤波理论由于可以灵活地设计出精度最优或容错能力最强的组合导航系统,已受到导航界的高度重视,在研究分析联邦卡尔曼滤波器的算法和结构特点的基础上,提出一种适用于GPS/INS/TAN组合导航系统工程应用的联邦卡尔曼滤波方案,该方案采用无复位结构既保证了容错能力,又兼顾到了导航精度和运算速度,并对组合导航系统的各分系统、子滤波器
为抑制接收DS信号中的窄带干扰,研究了基于DFT只保留相位谱的DS信号接收方法,给出了该方法的一种迭代实现算法,有效降低了相位谱计算的运算量。讨论了该算法在DS系统抑制窄带干
提出了一种新的多用户OFDM系统中的快速子载波和比特分配算法。在给定每个用户数据传输的误比特率和数据速率的前提下,首先根据各用户的信号状况信息进行简单的初始分配确定最