强化学习在倒立摆起摆及平衡控制中的应用研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:backaroo2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
倒立摆系统是一个典型的多变量、非线性、高阶次、强耦合的自不稳定系统,只有采用行之有效的控制方法才能使其稳定在平衡位置附近。控制中的许多关键问题,如跟踪问题、镇定问题、鲁棒性问题、非线性问题等都能在倒立摆的控制过程中反映出来。同时,双足机器人的行走、卫星和火箭的位姿调整等均与倒立摆系统具有相似之处。因此,对倒立摆系统的研究具有重要的理论价值和应用价值。传统的倒立摆控制方法如PID控制、LQR控制等都是基于模型的控制,实际中很难获得倒立摆系统的精确的数学模型。强化学习作为机器学习的一种,其与监督学习不同之处在于其不需要教师信号,它强调与环境的交互过程中获得评价性反馈信号,利用评价信息来实现行为决策的优化,不需要知道系统模型,这就避免了因建模造成的误差。因此,本文将强化学习应用于倒立摆的起摆及平衡控制任务中,重点研究了强化学习算法在倒立摆平衡控制中的应用。本文的主要成果有:(1)起摆控制方面,研允了基于Q学习算法的倒立摆起摆控制。一级倒立摆起摆仿真控制实验表明了Q学习算法在倒立摆起摆控制中的有效性。(2)平衡控制方面,在深入研究实现了最小二乘策略迭代(Least Square Policy Itcration,LSPI)以及基于稀疏核机器的最小二乘策略迭代(Kernel-based LSPI,KLSPI)两种有效的解决倒立摆平衡控制问题的强化学习算法的基础上,针对LSPI算法逼近能力、泛化能力差,KLSPI算法计算复杂度高、计算成本大的问题,提出了一种基于极限学习机(Extreme Learning Machine,ELM)的最小二乘策略迭代(ELM-LSPI)算法,在提高传统LSPI算法逼近精度、泛化能力的同时,控制了其计算成本。一级倒立摆控制仿真实验结果表明KLSPI算法和本文提出的ELM-LSPI算法均能提高LSPI算法的收敛能力和泛化能力,但ELM-LSPI算法的计算成本远小于KLSPI算法,更利于后续的实物研究和在线算法的拓展。
其他文献
高度重视农村义务教育,乡村振兴的基础工程和先行工程是农村义务教育,在新课标实施过程中,小学音乐课教师应遵循学生的身心特点,以学为本,以学定教,转变教师角色,让学生在课堂中体验
算法多样化包括计算方法和解题策略的多样化。提倡算法多样化是新课程标准的一个重要思想,因此,如何在尊重学生的个性,发挥学生的主体作用,鼓励学生独立思索,运用自己的方法来计算,有效组织引导学生实现算法的多样化,以致收到教学的最优化呢?  [案例1]例如在进行20以内进位加法“9加几”的教学中,计算9+5,学生想出了多种算法:(1)从9往后数,再数5个是14;(2)9+1=10,10+4=14;(3)把
新课程改革的实施,对于教师的发展在提出挑战的同时,也提供了宝贵的机会。在教育与课程改革的不断推进下,教师的角色发生了不断的转变,教师的专业化进程也获得不断的关注。教师在教育认识水平的提升方面,专业素养和专业技能的发展方面,知识结构的优化方面,合作意识的增强方面以及教学理念和教学方式的转变方面,都成为教师专业发展的重要因素。在新课程改革的背景下,英语教师专业发展需要英语教师要不断更新自身教学理念,提
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
随着科技的发展,儿童使用的玩教具越来越多,但针对残疾儿童可供选择的教具范围却十分狭小。本课题定位于植入人工耳蜗的学龄前听障儿童,从其玩教具使用实际情况出发进行全方
随着纳米技术与精准医学的不断发展,纳米药物与基因载体已被广泛应用于肿瘤等相关疾病的治疗。纳米技术不但能提高药物生物利用度,而且可以降低药物毒副作用,这对于开发新型
文章首先总结了典型风机、光储虚拟同步机技术发展现状和所遇到的问题,指出了后续研究工作的重点,分析了虚拟同步机主要结构一逆变器的设计及控制策略方面存在的问题.其次对
在全球化趋势日益彰显的今天,社会系统中的政治、经济、文化等子系统之间的相互影响和推动也会引起教育自身的嬗变,社会转型时期的人文价值和人文精神越来越受到社会的关注,教育
素质教育是和应试教育有根本区别的全新的教育理念。哲学教学方法的改革应以培养学生的创新能力和调动学生的积极性为原则。新的哲学教学方法有讲授法、谈话法、读书指导法、
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield