论文部分内容阅读
不确定性广泛存在于各类系统中,自动控制系统也不例外。这些不确定性来自于系统外部扰动、内部联结与耦合、子系统故障、参数波动等,不确定性的存在严重影响着系统的正常运行。自从有了控制理论以来,对不确定性的研究就从未停止,反馈控制、自适应控制、鲁棒控制与系统辨识都是解决不同类不确定性的典型代表。试图通过控制与辨识的方法使系统目标间的指标达到某种平衡,这种方法被称之为对偶自适应控制,在千禧之年其被IEEE Control Systems Magazine列为上世纪对控制理论有重大影响的25个问题之一。然而,这一极具理论意义和实用价值的公开难题至今没有得到圆满的解决。目前,针对此问题已经研究出了两种学习策略:主动学习策略和被动学习策略。现有的工作都是回避系统变量间的相互影响,提出来一些次优控制方法,其共同缺点是人为地剥夺了控制未来的主动探测权利,使所得的次优控制仅有被动学习的特点。
本文针对不确定性系统的对偶自适应控制问题,提出了控制器设计的新方法,旨在消除或减少系统中的可减少不确定性,使系统以最优的方式运行并达到预期期望性能。
本文的主要研究成果如下:
对于由模型中的未知参数产生的不确定性系统的控制问题,传统方法分为两个阶段,第一阶段搜集系统输入-输出数据,辨识出系统模型;第二阶段用己辨识出的模型与指标要求设计出所谓的最优控制。而对偶自适应控制将两个阶段融为一体,采用一边控制、一边辨识的策略。通过仿真本文的研究结果表明对偶自适应控制优于传统控制,睫之提出了对偶自适应控制设计的一般框架。
对偶自适应控制既然优于传统的控制策略,那么其具有哪些性质和内部规律性?借鉴于强化学习的探索-利用框架,本文获得了对偶自适应控制的探测-谨慎作用。
以LQG(Linear Quadratic Gaussian)为载体,针对其模型中的未知参数、环境扰动、测量噪声、初始状态等引起的不确定性问题,设计出了对偶自适应控制,该控制除了能够控制系统使其具有期望的二次性能指标,还能以事先给定的精度学习出包含未知参数的最小区间。
为挖掘大数据内部的规律性,针对具有未知参数的自回归滑动模型,以一步最优为目标,导出了与学习密切相关的学习指标,将控制目标与学习目标相结合,获得了具有学习特点的控制器设计方法。
针对一步控制目标的短视行为,本文在状态变量能够精确测量的约束下,获得了使系统整体最优的自适应对偶控制,该控制一方面能使系统朝着最优的方向运行,另一方面又能估计出未知参数,减少了系统的不确定性。
本文针对不确定性系统的对偶自适应控制问题,提出了控制器设计的新方法,旨在消除或减少系统中的可减少不确定性,使系统以最优的方式运行并达到预期期望性能。
本文的主要研究成果如下:
对于由模型中的未知参数产生的不确定性系统的控制问题,传统方法分为两个阶段,第一阶段搜集系统输入-输出数据,辨识出系统模型;第二阶段用己辨识出的模型与指标要求设计出所谓的最优控制。而对偶自适应控制将两个阶段融为一体,采用一边控制、一边辨识的策略。通过仿真本文的研究结果表明对偶自适应控制优于传统控制,睫之提出了对偶自适应控制设计的一般框架。
对偶自适应控制既然优于传统的控制策略,那么其具有哪些性质和内部规律性?借鉴于强化学习的探索-利用框架,本文获得了对偶自适应控制的探测-谨慎作用。
以LQG(Linear Quadratic Gaussian)为载体,针对其模型中的未知参数、环境扰动、测量噪声、初始状态等引起的不确定性问题,设计出了对偶自适应控制,该控制除了能够控制系统使其具有期望的二次性能指标,还能以事先给定的精度学习出包含未知参数的最小区间。
为挖掘大数据内部的规律性,针对具有未知参数的自回归滑动模型,以一步最优为目标,导出了与学习密切相关的学习指标,将控制目标与学习目标相结合,获得了具有学习特点的控制器设计方法。
针对一步控制目标的短视行为,本文在状态变量能够精确测量的约束下,获得了使系统整体最优的自适应对偶控制,该控制一方面能使系统朝着最优的方向运行,另一方面又能估计出未知参数,减少了系统的不确定性。