基于Q学习的欠驱动双足机器人行走控制研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:renrenxiaonei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
被动动态步行是双足步行研究领域的一个重要分支,其目的在于挖掘动态步行本质特征,充分利用自身动力学特性提高能效。由于机器人的结构多样性,动态特性具有较大差异,难以选用其他机器人的运动轨迹作为参考步态。而在机器人与地面的不断交互中,Q学习可以充分利用双足机器人自身的动力学特性,在试错中自主学习行走。本文针对五连杆欠驱动步行机器人行走控制,提出了基于神经网络的Q学习方法进行研究,实现了稳定连续的动态步行。本文完成的主要工作如下:1.采用了平面五连杆四驱动模型,并在已有的柔性驱动方式的基础上,为机器人选择了柔性驱动器。2.提出了一种基于RBF神经网络的Q学习控制方法。利用RBF网络的泛化能力,代替了离散的Q值表,实现了机器人连续状态到离散的Q值表的映射关系,解决空间信度问题;将资格迹思想融入到RBF神经网络中,解决Q学习时间信度分配问题;借鉴了等效倒立摆模型降低神经网络输入维度;提出了改进的ε贪婪算法来平衡Q学习中“探索”与“利用”的矛盾。仿真得到了稳定自然的周期动态步态,验证了基于RBF神经网络的Q学习算法的有效性。3.为了解决Q学习“无监督”、状态-动作空间大带来的学习速度慢的难题,本文采用了基于历史经验回放技术加速Q学习。仿真表明基于历史经验回放技术能提高Q学习效率。4.设计了ADAMS仿真平台。为得到更为实际的仿真效果,建立了ADAMS上的虚拟样机。在此基础上建立了ADAMS与MATLAB的联合仿真平台。仿真实验表明仿真平台能简化繁琐的操作,提高了仿真效率。
其他文献
光学相干层析成像技术(Optical Coherence Tomography, OCT)是20世纪90年代迅速发展起来的一种新型光学检测技术。它通过测量后向散射光强、回波时间延迟和相位参数特征,获取被测物体内部的结构信息并进行高分辨率横断面成像。光学相干层析成像技术是一种非介入型,无损伤光学检测技术,其获得的图像分辨率可达到1~15μm,比传统的超声波成像高1~2个数量级,并且其体积和制造成本远
早在上个世纪末,由于能源危机的影响,世界各国开始关注可再生能源的开发和利用。在这些可再生能源中,风能不仅对环境无污染、施工周期短,还具有实际占地少、24小时都可获得和储量巨大等优点,因此,越来越受到世界各国的重视,逐渐成为最重要和最有开发前途的可再生能源之一。随着世界各地风场装机容量的不断扩大,如何最大程度地利用风能、提高风能转换效率已经成为风力发电技术研究的重要内容之一。本文以变速恒频双馈感应发
紫外线(UV,Ultraviolet)固化是在紫外光辐照下,液态的可光固化的低聚物经交联聚合而形成固态产物的过程。UV灯的光辐射效果影响固化效果,研究UV灯电路的启动和控制方式,对提高UV
随着计算机、图像处理等技术的飞速发展,机器人在各种领域得到了广泛应用,但是目前在工业生产中应用的机器人,一般采用示教再现或者离线编程的工作方式,只能执行事先规划好的重复
多相机系统是由2个或2个以上、相同或不同类型的相机构建的,能够获取场景图像的摄像系统,它广泛应用到飞艇、无人机、室内定轨等摄像测量领域中,主要用于解决多视场、长时间、大
蜂拥现象广泛存在于生物群落中,系统、深入地研究蜂拥控制问题,不仅有助于揭示生物群落蜂拥行为的内在机理,还能够为多机器人编队、无人机组网、无线传感器网络等人造工业系统的
运动目标跟踪是计算机视觉领域中的研究热点,它涉及图像处理、人工智能以及模式识别等多种理论,是一门多学科交叉的技术,广泛应用于智能监控系统、人机交互、医学和生物、导航制
随着全球能源问题日益严重,环境问题也显的日益的突出,开发全新的能源刻不容缓。环境问题是大家都关注的问题,必须营造一个可持续发展的模式才能真正走可持续发展的道路。而
随着全球能源危机的加剧和环境污染的日益严重,世界各国都正在加大对绿色可再生能源的开发研究,寻求更多能有效改善能源和环境问题的方法。太阳能光伏发电具有清洁无污染、取之不尽用之不竭的特点,已成为广大电力科学工作者的重点研究课题,也是国家政策和智能电网建设的重点扶持对象。但由于光伏发电系统所接收的太阳能存在间歇性和随机性,也致使光伏并网发电系统存在系列问题。本课题为改善光伏并网发电系统的稳定运行和完成系
我国北方居民的供暖系统一直采用按面积收费,但这种收费的不合理在近些年越来越突出,用户不能根据自己的实际情况进行调节,产生了浪费现象,智能化程度也不足。因此市场上开始逐渐