【摘 要】
:
针对传统PID控制器无法在线自整定参数的不足,提出了一种基于执行器-评估器(Actor-Critic,AC)学习的自适应PID控制器结构与学习算法.该控制器利用AC学习实现PID参数的自适应
【机 构】
:
广东工业大学应用数学学院,广东工业大学自动化学院
论文部分内容阅读
针对传统PID控制器无法在线自整定参数的不足,提出了一种基于执行器-评估器(Actor-Critic,AC)学习的自适应PID控制器结构与学习算法.该控制器利用AC学习实现PID参数的自适应整定,采用一个径向基函数网络同时对Actor的策略函数和Critic的值函数进行逼近.径向基函数网络的输入为系统误差、误差的一次差分和二次差分,Actor实现系统状态到PID参数的映射,Critic则对Actor的输出进行评判并且生成时序差分(temporal difference,TD)误差信号.基于AC学习的体系结构和TD误差性能指标,给出了控制器设计的步骤流程图.两个仿真实验表明:与传统的PID控制器相比,基于AC学习的PID控制器在响应速度和自适应能力方面要优于传统PID控制器.
其他文献
本文从消费心理视角出发,引入感知价值和社会认同变量,探讨城市居民信息性影响对两代农民工购买意愿的影响机制差异。基于840份两代农民工购买意愿的调查问卷,运用Bootstrapp
从卫生经济学的角度出发,采用何种手段才易使病人接受,保护残余肾功,阻止其恶化,改善其生存质量;推迟肾替代治疗和减轻维持性透析患者的合并症;减少社会卫生经济负担便成了人们倍加
通过解读威廉.布莱克的两首玫瑰诗歌The Sick Rose和My Pretty Rose Tree,带大家走近诗人布莱克笔下的"病"玫瑰和"妒"玫瑰。我们应该在了解诗歌相关背景的基础上,发挥想象,拥有各
通阳为桂枝功用的核心,在临床中治疗心血管疾病,各方中处处利用桂枝,加减变化不离桂枝,应用十分广泛,包括胸痹心痛、痰饮气逆之心痛证、心下悸、心动悸、奔豚气、水肿等。临
结合多任务并行开展的任务特点,通过优化工作流程、合理调整资源配置实现保障资源利用率最大化、工作效率最大化和人员资源产出比最大化,有效缩短了产品保障周期,降低保障成
民商法是最为贴近民生问题的法律典范,关系到人民群众生活的各个方面。而在我国民商法中连带责任又扮演着十分重要的角色。因此,本文聚焦于民商法中连带责任,首先分析了连带
针对非线性预测控制如何在有限时域内有效的求解非凸非线性规划这一关键问题,本文采用序列二次规划方法,将非线性规划转化为一系列二次子规划求解.首先根据非线性规划联立方
目的:研究道地知母药材中的挥发性成分。方法:采用气相色谱-质谱(GC-MS)联用技术,对道地知母药材中挥发性成分进行分析和鉴定。结果:从道地知母挥发性成分中分离出60个色谱峰
本文从理论上探讨了无形资产价值评估的基本方法及评估中应注意解决的几个问题。
为修订儿童考试焦虑量表(Children’s Test Anxiety Scale,CTAS)的简版,使用儿童考试焦虑量表对563名3~6年级小学生进行测试,并对测试数据进行探索性因素分析和验证性因素分析