基于Actor-Critic学习的自适应PID控制策略研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:buffisher
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
PID控制器是现代工业中最常用的控制器,具有结构简单、容易实现、控制效果好和鲁棒性强等特点,能够满足一般的工业控制要求。随着技术的进步,人们对控制精度要求不断提高。电液伺服系统存在非线性、时变性、不确定性和干扰力等因素。实现高精度控制,控制器的参数应该随着系统变化而自动调整到最佳,而常规PID控制器在控制过程中,参数一旦确定,就无法调整。因此,对于精度要求高的系统,常规PID控制器往往难以达到理想的控制效果。由于人工智能技术的迅速发展,研究人员将人工智能算法与PID控制结合起来,能够实现参数自适应的PID控制器成为了研究热点,拥有较高的研究价值和广阔的应用前景。强化学习作为一种机器学习方法,强调在与环境交互学习中获得评价性的回报信号,以极大化未来的回报为学习目标。它不需要教师信号,在求解先验信息较少的复杂优化决策问题中应用广泛。在多种领域中,已显示出其性能优势。因此,本文提出了一种基于强化学习思想中Actor-Critic结构的控制策略,以解决PID参数不能在线调整的问题。该策略不需先验知识,能够对参数进行在线调整,实现系统性能优化。通过MATLAB中的Simulink模块进行仿真分析,并在燕山大学的液压元件及系统综合创新平台上进行实验验证,结果均表明,与传统PID控制策略和其他PID参数寻优算法相比,该控制器控制的系统具有更好的动态响应特性和抗扰动能力。
其他文献
阐述了木构古建筑变形监测的现状,介绍了基于光纤光栅的应变传感器技术,并在宁波市保国寺大殿主梁应变监测中进行了应用研究,通过人工重力加载试验研究了主梁的协同工作性能,
目前,我国旅行社产品同质化现象严重,要在激烈的竞争中生存和发展,应该采取旅游线路产品差异化策略、旅游服务差异化策略及营销差异化策略等,最终实现品牌化发展,促使旅行社
文章针对智能电子标签设计中的一些关键问题进行了深入的研究和探讨,在系统设计、电源整流与稳压、10%ASK信号解调、低功耗EEPROM设计等方面提出了新的思路和方法,同时给出了
在阐述我国油茶产业现状的基础上,分析了目前制约油茶产业发展的主要因素和在当前形式下,油茶产业相对于其他产业的一些优势,指出油茶产业拥有很大的发展空间。
随着2017年颁布的《普通高中英语课程标准》的实施,英语课堂中文化意识和文化教学的理念更加引起教师和学生的关注和重视。文化与语言之间存在着紧密的联系,要想更好的达到英
随着两轮电动车旧国标暴露的问题越来越多,对两轮电动车新国标的呼声也越来越高。新国标增强了产品的安全性,消除了旧国标技术漏洞,切实保障了人民群众生命财产安全。同时,两轮电动车市场保有量很大,制定新国标对两轮电动车产品结构调整和企业发展有很好的促进作用。虽然新国标的制定经历了很长时间,但一直未引起两轮电动车企业足够重视。直到2018年《电动自行车安全技术规范》GB17761-2018和《电动摩托车和电
为了解宁波市商业体育健身俱乐部连锁经营的相关情况,运用问卷调查、专家访谈及文献资料等研究方法,对宁波市商业体育健身俱乐部的管理者、教练员以及消费者等一系列问题进行
利用光电池的光电转换特性,把光信号的强弱转变成电信号的强弱。根据硅光电池的光照短路电流的特性(即短路电流与光照度成线性关系),把硅光电池接受到的光信号转换成电流信号
校园事故的不断发生昭示了学校的安全稳定存在着不能忽视的弊病。抓好校园安全工作,必须要明确安全责任。学校作为安全责任的主体,就必须要把安全工作摆在一切工作的突出位置
目的:评价经皮穴位电刺激对老年冠心病患者围术期超敏肌钙蛋白T及心率变异性的影响。方法:选择合并冠心病拟择期全身麻醉下行腰椎后路减压植骨融合内固定术患者50例,不限性别,年龄6580岁,ASAⅡ/Ⅲ级,体重指数(BMI)1927 kg/m2,采用随机数字表法分为两组(n=25):对照组(C组)和经皮穴位电刺激组(T组)。T组于诱导前30 min开始刺激双侧内关穴、郄门穴至手术结束,疏密波,频率4/2