基于策略迭代优化的一类非线性系统自适应控制器设计

来源 :安徽大学 | 被引量 : 0次 | 上传用户:anmy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际的控制过程中,控制对象往往是复杂的,存在不确定性的,其模型的参数可能在很大范围内发生变化。对于连续时间非、线性时不变系统的最优控制问题,由于控制有相对的条件,而实际情况可能随时不同,优化控制的过程需要不断更新完善,从而保证控制算法更加合理和精确。因此,开发一种自适应优化控制器,能够随时根据外部环境的变化而改变控制策略,使控制器一直处于最优的状态尤为重要。更多的是,当系统动态信息完全未知的情况下,如何运用设计的控制方法,使系统仍旧可以达到最优控制状态,这是眼前亟待解决的问题。鉴于以上情况,本文对基于策略迭代优化得一类非线性系统的自适应优化控制器展开研究,主要从以下几个方面进行:第二章中,主要针对仿射非线性系统的优化问题设计一种新的控制方案。基于神经网络结构,我们提出了一种有效的系统线性化方法,线性微分包含技术。这解决了目前由于高度非线性存在导致的“维数灾难”问题,接着,我们提出了一种在线策略迭代算法,当系统的动态信息A不可获取时,仍然可以通过状态和输入驱动信息来获取系统的最优控制。最后,通过仿真验证了所提方法的有效性和适用性。第三章我们主要研究非线性系统的信号跟踪问题。同样,在处理系统的非线性上,采用的是基于神经网络的线性微分包含技术。接着,通过给出的参考信号动力学信息,搭建了增广系统,推导该系统下的代数Riccati方程,提出了离线和在线两种策略迭代算法。在仿真部分,我们对在线算法和PID算法进行了比较,突出本节提出算法的优越性和可行性。第四章研究了一种强化学习方法来解决半车主动悬架系统的最优控制问题。根据相关运动学方程,构建了模糊动力学模型。同时,为了解决系统中的非线性项,我们采用一系列模糊规则将所考虑的非线性系统转化为Takagi-Sugeno模糊子系统。这样系统下的最优控制问题就变成了零和博弈的纳什均衡问题。通过使用积分强化学习,我们设计了相关算法来求得系统最优控制器。在这过程中,系统的动态信息可以完全忽略,最后通过仿真验证了我们设计的算法的实用性和可行性。最后,我们对本论文提出的方案进行了总结,并对未来的工作给出展望。
其他文献
近年来,随着科技的发展和经济实力的提高,我国正面临着复杂的大气环境问题,臭氧作为大气污染物的来源之一,日益引起人们得重视。地基仪器对臭氧浓度的测量优势是易于对仪器进行维护和标定,并且地基仪器的臭氧观测资料稳定性和连续性高,对于某一地区的臭氧浓度变化研究具有很重要的意义。国际上典型的地基臭氧观测仪器Dobson、Brewer和UV-PFR均为通道式太阳光度计,相对于连续光谱,通道式太阳光度计仍然具有
学位
数字图像相关技术(digital image correlation,DIC)是一种非接触式的全场位移和变形测量方法,因具有对环境要求低、测量精度高等优势而被广泛应用于材料的力学性能测试中。一般通过采集被测物体在变形前后的数字图像,进行图像匹配、计算,从而得到全场应变和位移。鲤鱼皮作为一种常见的生物材料,其优质的胶原蛋白在医疗、化妆等领域已有重要应用,但其机械性能在亲水和脱水情况下,差异显著,为全
学位
在数字经济时代的背景下,高效地从大数据中提取有用信息用于预测,具有重要的理论意义和现实意义。基于高维宏观经济数据和百度搜索指数构建监督因子模型,分别利用缩放主成分分析(s-PCA)和偏最小二乘(PLS)提取因子预测我国的CPI。在此基础上,进一步利用LASSO筛选变量,对因子估计施加“双重监督”,考察“双重监督”因子模型的信息提取效率。实证结果表明:相比于无监督因子模型,监督因子模型对CPI及其“
期刊
种子散布是指植物种子远离母树的过程,是植物更新的重要环节,直接影响植物种群更新和生物多样性维持。在以往的种子散布研究中,通常选取种子的被散布比例的高低和散布距离的远近等指标来评估动物对种子的散布效率,然而这些指标是分别衡量整个种子散布过程中的某一特定阶段,并不能从整体上探讨动物的种子散布作用对植物幼苗更新的影响。种子散布效率(SDE)这一概念的出现在很大程度上弥补了上述指标的不足,SDE同时包含种
学位
分布式电源(Distribution Generation,DG)介入配电网使其电压波动明显且网损较大,同时给配电网各无功调节装置相互协调带来了很大的挑战。无功优化的研究意义在于能够将配电网的无功调节装置进行更好地协调。本文主要采用的是数据驱动和深度学习的方法对于配电网的无功优化来进行研究。本文的主要研究包括三部分:第一,将模糊聚类算法以及混沌优化人工鱼群算法相结合形成了一种模糊聚类下混沌优化算法
学位
高精度机电伺服系统广泛应用于精密跟踪雷达、天基红外预警系统、射电天文望远镜、激光通信端机和车载动中通等军用核心设备中。这些设备通常被要求处于极端恶劣的工作环境中,且在低速工况下会不可避免地受到非线性摩擦、齿隙、死区以及电机力矩波动等不可抗力扰动因素的影响,以至于不能实现预先期望的控制目标和跟踪精度。研究如何提高机电伺服系统的控制精确性和实现其平稳运行能力越来越成为反映一个国家国防实力与尖端科技水平
学位
色选机作为一种先进的高度自动化分选装备,在食品加工、矿产分选等不同领域中都有十分重要的应用价值。色选机的工作方式是通过对采集图像的处理与分析,定位出不同品级物料的位置,然后通过自动喷气阀装置完成分选。随着农业信息化与智能化的不断推进,色选机技术在不同实际场景下的应用越来越广泛,因此研究针对不同农作物的特定品级识别方法有着十分重要的现实意义。由于色选机常常用于大规模物料的分选工作中,因此色选机场景下
学位
医学图像配准是医学图像分析领域中举足轻重的一个方向,是医学图像融合与图像引导治疗等场景的核心技术,其主要任务为寻找对应图像之间的空间关系,使得对应图像保持空间坐标一致性。对于不同的实际应用,一般会使用不同的配准技术,其中包括针对整体变形的刚性配准与针对局部变形的非刚性配准。由于医学图像存在梯度复杂与体素强度不均匀等原因,精确配准医学图像成为了一项具有挑战性的任务。为了克服上述问题,本文主要开展了以
学位
作为机械构件动力学分析研究中的基本模型,悬臂梁结构不仅可以作为被驱动元件进行振动分析,还可以作为激励源驱动外部负载。当利用振动的悬臂梁直接驱动负载时,如何使负载获得更多的能量、使悬臂梁的能量输出达到最优,是研究中的一个难点,需要使悬臂梁、负载、负载连接件之间进行相应的阻抗匹配。考虑到悬臂梁连续体模型的复杂性,本文选取悬臂梁结构的根部、中部和端部三个特征位置进行分析,提出压电驱动三段式悬臂梁结构的负
学位
基于通信网络的控制作为现代自动控制领域的一种新技术,因其通用性和适应性,在军事、航天、工业、农业以及车辆等领域得到了广泛的应用,其中,优化控制策略在上述领域的发展过程中占据主导地位。随着控制系统的日益复杂以及不确定的因素太多,人们无法通过传统的离线方法解出哈密顿-雅可比-贝尔曼方程,控制器的设计就成为一个难题。随着神经网络、强化学习和模糊控制方法的出现,自适应动态规划方法在求解约束控制的问题上备受
学位