移动机器人在未知环境下的学习控制方法研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:ares_ding
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动机器人是机器人领域的重要研究方向,集人工智能、信息检测、信息处理、智能控制等专业技术为一体。实际应用的机器人往往需要在未知环境中工作,研究未知环境下移动机器人的学习控制具有很大的现实意义。移动机器人的自主学习能力是其能否在未知环境下顺利工作的关键,本文对移动机器人未知环境下的学习控制方法进行研究。本文的主要工作和成果如下:1.针对传统人工势场法存在的问题,提出一种改进的人工势场法,对目标不可达和局部极小点问题采取了针对性举措,在一个未知的三维仿真环境中实现了移动机器人寻找到目标的任务。2.针对一般强化学习只适用于一些环境状态空间比较小、智能体行为选择也比较单一的情形,对于连续或高维状态空间的环境算法性能不佳的问题,提出一种基于单位矢量场和启发式规划的Dyna结构优化算法,将单位矢量场和启发式规划同时引入到Dyna框架中,大大减少了对状态空间的盲目搜索。3.针对真实环境中的连续状态空间造成的“维数灾”问题,提出了一种新的环境状态空间的定义方法,将连续状态空间离散化;同时针对强化学习学习效率不高的问题,在奖赏函数中引入启发式奖赏,减少盲目搜索的概率,使动作选择更有目的性。面向实际应用场景,提出一种基于未知环境状态空间新定义及利用启发式奖赏的机器人导航Q学习算法,该算法对于未知环境有很好的适应性和泛化能力,在未知动态环境应用也取得了不错的效果。4.很多强化学习算法只是在Matlab等仿真平台上实现,与实际应用有较大的距离,限制了算法的可移植性。本课题在仿真平台Simbad上进行机器人的学习控制应用研究,算法采用Java语言实现,Simbad搭建的是一个三维的复杂环境,机器人通过各种传感器获得环境信息,对于实际环境中的应用有更大的参考价值。
其他文献
学位
随着Internet的快速发展,网络中的流量成几何级数递增,而且不同类型的业务流要求获得不同等级的服务质量(QoS)保证。在这种情况下,需要对整个网络的流量进行均衡分派,并调节全网
复杂系统研究是新世纪的前沿课题,具有重要的理论a意义和实用价值.从工业社会向信息社会转变过程中,电子政务和复杂性科学之间存在内在本质的联系.本报告第一部分从系统方法
该文主要介绍和研究了多变量系统辨识的子空间状态空间辨识方法.首先,深入学习了多变量系统辨识的理论和方法,重点研究了子空间状态空间系统辨识算法的理论与算法的实现步骤.
面对日益增加的竞争压力和小批量多品种的市场需求,国际上越来越多的制造企业从总体战略出发,纷纷采用供应链管理模式与企业资源计划(ERP)系统运营方式,以实现对企业的整体优化
数字航向仪是一种获取载体航姿量的设备,主要用于航海、航天、航空系统的导航。本次设计的这种数字航向仪除了提供载体的航向角,还提供了载体俯仰角和翻滚角两个姿态量,并以数字
故障诊断是随着机器工业大生产的发展而逐步发展形成的。特别是进入二十世纪六十年代后,随着传感器技术、测试技术、计算机技术和信号分析的迅猛发展,故障诊断呈现出新的面貌,并
我们没能见识到蒸汽机时代,也没能见识到电的发明给工业带来的翻天覆地的变化.不过,我们却很幸运的赶上了计算机时代,并且继续迈向信息时代.我们在尽情的享受信息给我们带来
焦化生产的前提是必须有一个完善的各煤系统,将配合煤料输送到煤塔作为炼焦的原料,出焦后需要一个筛焦系统将焦炭块筛分成不同用途规格的产品,同时需要一个除尘系统实现无污染生
本文研究了视频传输在网络控制系统中的应用。通过分析网络控制系统对视频传输性能的要求,比较和探讨了各种网络视频传输技术,如压缩编码方法、网络传输协议等,提出了针对网络控