基于双深度Q网络的智能决策系统研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户：sun949423350

【摘要】

：

目前智能决策系统中的经典算法智能化程度较低,而更为先进的强化学习算法应用于复杂决策任务又会导致存储上的维度灾难问题.针对该问题,提出了一种基于双深度Q网络的智能决策算法,改进了目标Q值计算方法,并将动作选择和策略评估分开进行,从而获得更加稳定有效的策略.智能体对输入状态进行训练,输出一个较优的动作来驱动智能体行为,包括环境感知、动作感知及任务协同等,继而在复杂度较高的决策环境中顺利完成给定任务.基于Unity3D游戏引擎开发了虚拟智能对抗演练的验证系统,对演练实时状态和智能体训练结果进行可视化,验证了双深

【作者】

：

况立群冯利韩燮贾炅昊郭广行

【机构】

：

中北大学大数据学院,山西太原 030051;北方自动控制技术研究所,山西太原 030006;太原师范学院地理科学学院,山西太原 030006

【出处】

：

计算机技术与发展

【发表日期】

：

2022年2期

【关键词】

：

深度强化学习深度Q网络对抗演练仿真训练 Unity3D

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于双深度Q网络的智能决策系统研究

其他学术论文