强化学习在机器博弈上的应用综述

来源 :控制工程 | 被引量 : 0次 | 上传用户:jhwangseagull
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能是未来科技发展的必然趋势,将会对世界产生巨大的影响,而机器博弈更是人工智能研究的热点内容.目前,解决机器博弈问题最先进的算法都来源于强化学习.强化学习是机器学习最重要的方法之一,主要用来解决决策问题.它具有接近人类思维的学习机制,通过试错的方式同环境发生交互,累积最大奖赏并得到最优策略.博弈具有多种多样的形式,内容也十分广泛,根据不同的标准会产生不同的分类,可以将其分为完全信息博弈和非完全信息博弈,但它们都可以通过强化学习进行解决.
其他文献
阐述智慧校园在校园一卡通系统的基础上,进一步整合校园业务系统,建设一卡通大数据分析平台,让业务系统内的大量数据为学生管理服务,通过大数据挖掘,实现学生管理的个性化、细致化,从而对学生管理工作做到更加科学化和数据化.
设计一种基于ZigBee和物联网云平台的环境监测与自动化控制系统。通过ZigBee技术组建传感网络并由终端采集环境参数、控制端预设程序、自动控制环境调控设备,创造作物最佳生长环境。
乙烯裂解炉是乙烯装置中最关键的核心设备单元,对保障其运行的安全性及稳定性尤为重要.因此,对其进行过程监测及故障诊断具有非常重要的意义.主元分析法(PCA)在过程监测与故障诊断中被广泛应用,T2贡献图是其故障诊断的主要依据,但由于控制系统对过程偏离的迅速响应,基于贡献图的故障诊断分析结果也会相应改变,致使真实的故障原因被掩盖.针对乙烯裂解炉运行系统,基于T2贡献值曲线,对监测超限样本中各个变量的T2贡献值进行累计计算分析,实现了对引起乙烯裂解炉故障原因的正确识别,该方法得到某石油化工厂实际工业生产的DCS数
为了提高对干扰系统建模的准确性,将被控输出作为状态建立增广的状态方程,提出基于增量状态空间模型和人工干扰模型的双层模型预测控制方案.该方案给出了增广模型的可检测性条件.利用稳态Kalman滤波得到增广的状态估计,在Kalman预报中对当前输出值和估计值的偏差进行补偿,获得准确的开环预测值.引入稳态目标计算获得最优的目标值以保证无静差控制.采用增量状态空间模型避免了工作平衡点的影响.仿真算例证实该方案能保证系统在有干扰出现的情况下可靠地跟踪稳态目标值,验证了该方案的有效性.
阐述机电工程技术在传感设备中有着广泛的应用,要保证传感器的应用效果得到提升,就必须从其精度、灵敏度和稳定性入手,使传感器能够有效地抵御外界的影响.探讨机电工程自动化的技术,包括提高工业生产效率、提高工业生产质量、自动化技术的创新、柔性化与智能化.
阐述利用网络化实验实训平台模拟真实操作效果,可以全过程实时了解学生操作流程,还可以将学生整个操作过程完整地保留下来,探讨基于数据库日志管理和中间件理论的新型实验实训体系.
阐述交通信息化发展中的智慧公交、仓库管理系统设计,基于宜昌公交集团的案例分析,探讨智慧公交的仓库管理现状,系统的功能架构,宜昌智慧公交的仓库管理系统的建设方案.
数据降维是化工过程故障识别的重要组成部分,主要分为特征提取和特征选择两种方法.为了探索不同数据降维方法对化工过程故障识别的影响,提出了基于数据降维和深度学习的故障识别方法.首先,生成拓扑映射(GTM)得到了原始过程数据的低维空间表示,通过Spearman秩相关系数(SRCC)得到了变量之间的相关性,获得了关键变量.然后,长短期记忆网络(LSTM)学习关键变量集的深层次特征并识别化工过程的故障.田纳西-伊斯曼(TE)过程的应用表明,GTM-LSTM更适用于跃变型故障的识别,SRCC-LSTM对所有类型的故障
针对无人机机动飞行所具有的非线性、强耦合、舵面操纵效率低等问题,采用了Backstepping控制方法对无人机机动飞行控制律进行了设计.同时,为了解决舵面操纵效率低带来的舵面角速率饱和的问题,设计了舵机层控制律,减弱了舵机角速率饱和带来的影响.分析了该控制律克服舵机角速率影响的机理,并采用李雅普诺夫稳定性定理分析了该控制器的稳定性.仿真结果表明,所设计的控制方法使无人机可以获得和矢量控制相似的机动效果,有效地解决了机动飞行过程中舵面角速率饱和带来的影响.
为了实现对煤与瓦斯突出的快速、准确和动态预测,考虑煤与瓦斯突出的多种影响因素,提出了基于AdaBoost增强学习和逻辑回归(LR)的煤与瓦斯突出预测方法.在AdaBoost的框架下,进行LR多次学习,完成煤与瓦斯突出预测模型构建;加入学习率和正则化参数进行控制,弱化学习效果,防止过拟合;基于反馈的实际结果,完成煤与瓦斯突出预测模型的修正.根据实例验证结果,构建的煤与瓦斯突出预测模型建模过程稳定、准确性高、建模消耗时间短、满足实时要求,证明了提出的煤与瓦斯突出预测模型构建算法是有效的.