连续时间系统的学习型预测控制及其应用研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:jj80022084
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近似动态规划(Adaptive Dynamic Programming,ADP)和模型预测控制(Model Predictive Control,MPC)是求解连续时间系统最优控制问题的有效方法。但是模型预测控制方法受到非线性的影响实时性难以保证;另一方面传统的无限时域的近似动态规划方法虽然具有较强的处理非线性的能力,但是却存在学习效率低的问题。因此本文将这两种方法进行结合,研究一种连续时间的学习型的预测控制方法(Learning-based Predictive Control)。运动控制技术是智能驾驶关键技术之一,受到车辆系统强非线性以及道路环境因素的影响,使得传统运动控制方法面临困境。本文针对智能车的路径跟踪问题,考虑执行机构的约束,设计了基于学习型预测控制的路径跟踪方法,使得智能驾驶车辆能够在不同车速下跟踪多种道路场景。本文的主要创新点如下:(1)针对一类输入受限的连续施加非线性系统的最优控制问题,提出了一种滚动时域的自评价学习方法(Receding-horizon Based Adaptive Critic Learning,RHACL)。该方法采用滚动优化的机制,将无限时域的最优控制问题转化为一系列有限时域的控制问题。通过采用非二次型的回报函数处理系统输入受限的问题。在预测时域内设计了与时间相关的执行器-评价器网络,用以逼近时变的值函数与最优控制策略,并设计了在线同步的权重更新规则,在理论上证明了网络权重的估计误差是一致最终有界的。倒立摆的仿真结果表明提出的RHACL算法相比于无限时域ADP方法和离散时间HDP方法在收敛速度上调高了50%,在控制代价上降低了6.5%;在相同预测时域的条件下,RHACL算法的计算时间比MPC方法降低一个数量级。同时倒立摆的实验验证了RHACL算法的有效性。(2)针对一类模型未知的连续时间非线性系统的最优控制问题,提出了一种数据驱动的滚动时域自评价学习(Data-driven RHACL,DRHACL)方法。在该方法中设计了基于神经网络的辨识器用以解决系统模型未知的问题;为了提高网络的逼近能力采用了稀疏核的方法构建辨识器网络的基函数,并在理论上证明了辨识误差能够收敛到零。在辨识器的基础上重新设计了执行器-评价器网络的结构以及权重跟新规则。Vander Pol振荡器的仿真结果表明提出的DRHACL算法在控制代价上比无限时域ADP方法降低了14%,比离散时间HDP方法降低了29%;而在相同预测时域的条件下DRHACL算法的计算时间比MPC方法减少了70%。倒立摆实验验证了基于核特征表示的辨识算法能够以较高的精度逼近实际系统模型,同时也证明了DRHACL算法的有效性。(3)提出了一种基于学习型预测控制的车辆路径跟踪方法。首先构建了智能车的动力学模型和侧向偏差模型。然后设计了基于RHACL的侧向运动控制方法,在该控制方法中前馈控制量由参考路径的曲率以及偏差模型计算得出;反馈控制量是使用RHACL算法求解最优跟踪控制问题得到。之后在模型参数未知的条件下设计了辨识器,在此基础设计了基于DRHACL的侧向运动控制方法。在该控制方法中转向的前馈控制量是由参考路径的曲率和辨识器模型计算得到,而反馈控制量是使用DRHACL算法求解最优跟踪控制问题得到。在仿真环境下完成了智能车进行换道路径跟踪、8字型道路跟踪以及组合道路跟踪的测试。仿真结果证明了基于RHACL和DRHACL的侧向运动控制方法能使智能车在不同车速下跟踪多种类型的道路,并且相比于MPC方法和纯跟踪方法所提出的侧向运动控制方法对道路曲率的突变具有一定的适应性。当车辆以50km/h跟踪大曲率弯道时基于RHACL和基于DRHACL的侧向运动控制方法产生的最大侧向偏差分别为0.4869m和0.5704m;在跟踪S弯时基于RHACL和基于DRHACL的侧向运动控制方法产生的最大侧向偏差分别为0.5901m和2.44m。并且这些跟踪结果均优于同条件下的MPC与单纯跟踪方法。
其他文献
为了准确模拟液氢液氧增压输送系统的工作过程,探究相变对其工作特性的影响,论文以液氢液氧增压输送系统为研究对象,开展了运载火箭增压输送系统动力学建模仿真与分析研究,进行了增压输送系统的工作特性仿真与分析,揭示了相变对增压输送系统工作特性的影响规律。基于模块化建模思想,论文首先将增压输送系统拆分为贮箱增压模块、气源模块、管路模块以及阀门单机模块;接着建立了一种包含相变模型和实际混合气体模型的低温推进剂
学位
现代装备技术的发展日新月异,随着应用领域的纵深化和多元化,对装备品质也提出了更高的要求。声学品质作为装备品质中的重要一环,是衡量船舶、飞机、高铁等装备技术水平的重要指标之一。近年来,对这类装备舱室内部噪声的控制得到越来越多的关注,而对舱室结构开展隔声设计是实现舱内噪声控制的关键技术途径之一。传统隔声结构因受隔声质量定律控制,普遍难以在轻质、薄层条件下实现低频段的高效隔声,导致现有装备的舱内低频噪声
学位
新兴信息技术的应用和推广使得数据数量和类型日益丰富,成为推动经济发展和社会进步的重要资源。其中政府所掌握的数据作为一种公共数据涵盖了社会中大部分的信息资源,对政府数据的开发利用不仅为提升政府的民主治理和数字治理水平提供了新的路径,而且为数字经济的发展注入新的驱动力。国务院2016年发布的《“十三五”规划纲要》中明确提出要实施国家大数据战略,加快推动数据资源共享开放和开发应用。同年,李克强总理指出政
学位
月球极地地区由于其特殊的位置环境和科学探测价值,已经成为新时代月球探测的重要方向。而载人月球探测是一项复杂的系统工程,与无人探月相比,规模更大、要求更高、影响更加深远,其顶层任务规划设计需要对轨道方面的问题进行深入研究论证。本文以载人月球探测为背景,对极地探测任务的轨道设计和导航定位问题进行了研究,主要包括以下内容:设计并分析了从近直线晕轨道(Near Rectilinear Halo Orbit
学位
务农重民,国之大纲。国家持续关注三农问题,在农村地区实施乡村振兴,助力农业农村农民发展,山东作为农业大省,紧跟国家乡村战略部署,及时对接本省三农发展需求。伴随2010年以来电子商务模式迅速发展,传统经济产业“电子商务化”催生新型商业形态。在国家政策引导下电子商务在农村地区也迅速成为乡村振兴的有力武器、精准扶贫的有效工具,涉农电商在各地政策环境中因势得到实践与发展。山东省积极出台涉农电商政策,发挥本
学位
政务公开对于保障人民主体地位有着重要意义,而政务公开第三方评估能够检验政务公开工作的质量和水平,也有助于发挥政务公开的作用。我国从2016年开始全面推进政务公开工作,省、市、县各级地方政府相继委托第三方机构开展政务公开评估。在政务公开第三方评估中,各主体之间存在着委托代理关系,其在互动过程中也产生了种种问题。本文基于委托-代理理论,界定政务公开第三方评估相关概念,探究上海市J区政府、S区政府与Y局
学位
随着基本医疗保险全覆盖的基本实现,医保改革更加重视纵向结构的调整和多层次医疗保障体系的建设与发展,作为基本医疗保险扩展和延伸的大病保险,从实践之初就在提高大病患者的报销比例上发挥着重要作用,切实提高了大病患者的保障水平。我国大病保险的运行机制蕴含公共产品理论和福利多元主义理论的中心思想,采用政府向商业保险机构购买的方式运行,让市场机制得以进入到基本医保领域,其健康持续的发展不仅关系到城乡居民医疗保
学位
当石墨烯靠近金属的时候,在石墨烯和金属之间会激发一种特殊的石墨烯等离激元模式,被称为声学石墨烯等离激元(acoustic Graphene Plamons)模式。声学石墨烯等离激元模式具有线性色散关系、极高的波长压缩同时具备较强的光场局域能力。声学石墨烯等离激元可以把红外光子挤压进入极其狭窄甚至亚纳米尺度的区域,提供了强的光与物质相互作用的研究平台。但是,自由空间入射光和声学石墨烯等离激元波之间存
学位
星敏感器是目前常用来为飞机、导弹、航天器等装备提供姿态信息的一种用于进行高精度姿态测量的设备。星敏感器由星图获取、星点提取、星图识别和姿态计算四部分组成。其中星点提取目的是从星图中提取出有效星点质心坐标,星点提取的精确度将会影响后续姿态解算精确度。实际星图中存在诸多干扰因素,比如暗星、月光以及传感器噪声等,这些并不是星点像素,却消耗了大量缓存资源并且降低了星点提取算法实时性,多种异形星点光斑也会导
学位
近自由面超空泡航行器具有航速高、耐波性好、机动性强等特点,在军事和民用领域均有广泛应用。本文以超空泡近水面航行器为背景,采用理论分析与数值模拟相结合的方法,对近自由面空泡演化动力学机制开展研究,为近水面航行器设计提供技术基础。本文综合考虑自由界面效应、兴波效应、湍流和空化传质,针对复杂近自由界面空化流动,分别建立不可压缩与可压缩数值计算模型,采用VOF(Volume of Fluid)方法捕获空泡
学位