基于强化学习的移动机器人自主学习及导航控制

被引量 : 0次 | 上传用户:zhk42
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动机器人是一种能够在工作环境中自主移动并完成预定任务的智能系统,是机器人学和智能控制的一个重要研究领域,在工业、农业、民用以及军事等领域具有广泛的应用前景。在移动机器人的各项研究和应用中,导航是最基本和最重要的问题,移动机器人在其工作环境中必须具有可靠而灵活的自主移动能力,而基于学习的控制方法是实现机器人自主导航的关键技术。 在各种学习方法中,强化学习具有较强的在线自适应性和对复杂系统的自学习能力,且能较好地符合人们解决问题的心理习惯,在机器人导航研究中受到了广泛的关注。然而随着移动机器人应用领域的扩展,对机器人学习与导航控制技术也不断提出了新的挑战,尤其是针对实际工程应用的环境感知、强化学习在连续状态和动作空间的泛化、局部环境的反应式控制、基于混合式控制的大范围空间定性导航等都存在着亟待解决的问题。因此结合人工智能、自动控制、机器人学等领域的研究成果,通过自主学习实现未知环境下的导航控制,是一个关键的研究课题,在移动机器人理论研究和工程应用等方面均具有重要的意义。 本文在分析总结已有工作的基础上,以移动机器人自主学习和导航控制为主要研究内容,深入研究了基于强化学习及其改进方法的移动机器人反应式控制和分层式导航控制,针对不同的导航任务和环境感知信息特点,提出了相应的信息融合方法、知识表示方法、学习算法和控制结构,并从仿真和实际移动机器人硬件平台(ATU—Ⅱ)两个方面对所提出的方法进行了实验验证。主要的研究工作和贡献如下: (1)研究了基于多超声波传感器系统的数据融合及知识表示方法 设计了适用于移动机器人的多超声波传感器系统,并提出了一种基于多超声波传感器的目标识别方法。利用数据融合技术,根据多超声波传感器的TOF(Time-of-Flight)信息,提出了基于目标原型的目标识别和对感兴趣目标的主动探测方法,实现了移动机器人对室内特征环境较为准确的识别,为复杂任务的自动分解提供了一种合适的子目标来源。 基于灰色系统理论,提出了灰色测量系统与灰色传感器的概念,给出了感知信息的灰色表示与运算,并以多超声波传感器系统为例做了相应的说明。对环境状态的灰色表示与处理为导航问题中的混合地图创建、基于灰色控制规则的学习算法等奠定了基础。 (2)研究了基于强化学习的反应式控制方法 给出了一种基于强化学习和模糊逻辑的反应式控制方法,结合模糊逻辑实现了对感知信息的模糊化,有效处理了连续状态和动作空间问题;在实际控制中分别设计了避障和寻找目标点两种反应式行为分别进行学习训练,并根据行为融合输出最终控制命令,完成感知信息到移动机器人动作的映射。同时针对未知环境下机器人导航中存在的感知信息不完备、推理过程具有不确定性的特点,对基于灰色系统理论的知识表示和灰色强化函数进行了初步探
其他文献
面对复杂的运营环境,电网企业存在较大的运营风险,且对其缺乏全面监测和动态预警,研究从电网运营全过程角度设计了运营监测指标,建立成果性、驱动性指标,基于模特卡罗模拟方
随着我国学前教育事业的不断发展,学龄前儿童越来越受世人关注,尤其是发展和培养儿童健康人格,预防心理行为的问题方面。近年来学龄前儿童多动症的问题越来越突出,为了解学前
目前,网络教育主要注重资源建设,而对如何使用资源为学习者提供个性化的学习内容并没有进行深入系统的研究。特别是以重用和共享为目标,如何在网络教育技术标准上实现学习内
<正>我国科技型中小企业的快速发展,与目前融资难的状况是不相适应的。其根本原因是金融机构与企业之间的信息不对称,要从根本上解决科技型中小企业融资难的问题,就应该从政
平原君赵胜是赵武灵王之子,赵惠文王之弟,赵孝成王之叔,先后辅佐两代赵王,在赵国政坛纵横几十载,对赵国政治、外交均有重要影响。公元前265年至公元前259年赵国的拒燕之战、
<正> 2002年8月,全美最大的巧克力制造商好时公司宣布出售,雀巢准备倾“巢”而动,哪怕失去3A等级(公司最高评级)也在所不惜。据知情者透露,当时雀巢欲出资115亿美元,以每股82
对于信仰藏传佛教的藏民族来说,佛教以其博大精深的内涵,深刻地影响着自己生活的方方面面,因而与佛教相关的艺术形式也以不同的表现形式与流传方式广泛地存在于各大藏区,并在
干休所卫生资源有其特殊性。卫生服务包括不同领域,属性也有不同,对于需方而言,医疗服务是主动需求,而预防保健大多为被动需求。干休所卫生资源既要提供医疗服务,又要提供预
通过查阅大量的科技文献,深入了解国内外高大空间分层空调技术的应用和研究状况。以某市体育馆高大空间分层空调设计现状为对象,先对现有分层空调系统运行工况下的气流组织分布
针对利用单个观测站接收多个第三方辐射源信号来估计目标位置的无源相干定位问题,提出了一种基于最大似然的时差定位算法。首先根据时差测量与目标位置之间的函数关系,构建目