论文部分内容阅读
移动机器人是一种能够在工作环境中自主移动并完成预定任务的智能系统,是机器人学和智能控制的一个重要研究领域,在工业、农业、民用以及军事等领域具有广泛的应用前景。在移动机器人的各项研究和应用中,导航是最基本和最重要的问题,移动机器人在其工作环境中必须具有可靠而灵活的自主移动能力,而基于学习的控制方法是实现机器人自主导航的关键技术。 在各种学习方法中,强化学习具有较强的在线自适应性和对复杂系统的自学习能力,且能较好地符合人们解决问题的心理习惯,在机器人导航研究中受到了广泛的关注。然而随着移动机器人应用领域的扩展,对机器人学习与导航控制技术也不断提出了新的挑战,尤其是针对实际工程应用的环境感知、强化学习在连续状态和动作空间的泛化、局部环境的反应式控制、基于混合式控制的大范围空间定性导航等都存在着亟待解决的问题。因此结合人工智能、自动控制、机器人学等领域的研究成果,通过自主学习实现未知环境下的导航控制,是一个关键的研究课题,在移动机器人理论研究和工程应用等方面均具有重要的意义。 本文在分析总结已有工作的基础上,以移动机器人自主学习和导航控制为主要研究内容,深入研究了基于强化学习及其改进方法的移动机器人反应式控制和分层式导航控制,针对不同的导航任务和环境感知信息特点,提出了相应的信息融合方法、知识表示方法、学习算法和控制结构,并从仿真和实际移动机器人硬件平台(ATU—Ⅱ)两个方面对所提出的方法进行了实验验证。主要的研究工作和贡献如下: (1)研究了基于多超声波传感器系统的数据融合及知识表示方法 设计了适用于移动机器人的多超声波传感器系统,并提出了一种基于多超声波传感器的目标识别方法。利用数据融合技术,根据多超声波传感器的TOF(Time-of-Flight)信息,提出了基于目标原型的目标识别和对感兴趣目标的主动探测方法,实现了移动机器人对室内特征环境较为准确的识别,为复杂任务的自动分解提供了一种合适的子目标来源。 基于灰色系统理论,提出了灰色测量系统与灰色传感器的概念,给出了感知信息的灰色表示与运算,并以多超声波传感器系统为例做了相应的说明。对环境状态的灰色表示与处理为导航问题中的混合地图创建、基于灰色控制规则的学习算法等奠定了基础。 (2)研究了基于强化学习的反应式控制方法 给出了一种基于强化学习和模糊逻辑的反应式控制方法,结合模糊逻辑实现了对感知信息的模糊化,有效处理了连续状态和动作空间问题;在实际控制中分别设计了避障和寻找目标点两种反应式行为分别进行学习训练,并根据行为融合输出最终控制命令,完成感知信息到移动机器人动作的映射。同时针对未知环境下机器人导航中存在的感知信息不完备、推理过程具有不确定性的特点,对基于灰色系统理论的知识表示和灰色强化函数进行了初步探