室内环境下基于深度强化学习的路径规划方法研究

来源 :天津工业大学 | 被引量 : 0次 | 上传用户：haru

【摘要】

：

【作者】

：

孟祺

【机构】

：

天津工业大学

【出处】

：

天津工业大学

【发表日期】

：

2021年01期

【关键词】

：

强化学习深度估计路径规划室内环境移动机器人

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着汽车自动避障技术和服务机器人的逐渐发展,路径规划已经成为了移动机器人技术领域的热点问题。作为人工智能领域的深度强化学习由于不需要人工标记和不需要依赖先验知识的优势,目前多个领域已经结合实际应用对其进行了研究开发,同样在机器人路径规划任务中也有该方向的研究。本文使用单目相机作为机器人的感知手段,研究基于深度强化学习的室内自主避障问题。首先,在编码器-解码器网络结构的基础上,采用监督训练的方式,提出了一种可以利用单目视觉在嵌入式系统上实现高吞吐量高精度的轻量化深度估计的方法。目标嵌入式平台为Jetson TX2,在公开数据集NYU Depth V2上完成了模型的有效验证以及与其他深度估计算法的对比分析,表明该算法的优势性。其次,对深度强化学习的基础理论进行了深入的研究,针对DQN算法容易使Q值过估计,收敛较慢的特点,以及原始DQN算法中考虑影响因素片面而忽视了环境状态带来的价值,对原始DQN算法进行改进,使用改进后的算法与原始DQN网络进行对比实验,说明该方法的优势。然后,通过ROS系统和Gazebo仿真软件搭建了路径规划仿真的实验环境,用来进行静态避障算法的训练,再将仿真机器人Turtlebot2模型加入到仿真环境中,以此完成室内机器人路径规划仿真平台的搭建。最后,在建立的综合仿真平台中对Turtlebot2移动机器人进行深度强化学习算法模型的训练,之后在现实环境中进行了测试,验证了本文算法用于室内环境下路径规划任务的可行性。

其他文献

基于混合神经网络的心音分类识别算法研究

心音信号含有丰富的生理和病理信息,实时反映着心脏的健康状况,是医生诊断心血管疾病的重要凭据。目前针对心血管疾病的诊断仍以心脏听诊为主,极易因为主观因素造成误诊,结合目前深度学习算法的优良特性,如果能够研究出高效的心音分类算法对心音信号进行分类识别,这对心血管疾病的临床研究具有重要的参考价值。针对以上问题,基于心音信号的特点,本文提出两种不同混合神经网络的心音分类算法,较好地解决心音信号的分类识别问

学位

心音分类深度学习LPCMFCC混合神经网络特征融合

基于CMM模型的自动化生产线软件质量管理研究

制造业,一直是我国的支柱产业之一。然而,随着经济的发展,工厂的制造成本水涨船高,人力不足,人力成本增加,质量要求高,产能缺口大等问题不断地给工厂带来新的挑战。近年来,随着技术的发展,机器人、自动控制、大数据等新技术越来越多的使用到制造业中,自动化生产线的出现,对缓解上述问题,起到了一定的作用。用机器人取代人力,解决劳动力不足和人力成本上涨的问题,并提升产能和提高产品品质,是我国未来制造业发展的方向

学位

软件质量管理能力成熟度模型自动化生产线

基于静电吸附机理的服装机器人末端执行器研究

纺织服装行业是社会发展的支柱产业。随着人们生活水平的提高,纺织行业的消费市场已经由排浪式消费阶段向个性化消费阶段转变,传统的手工生产已经不能够适应时代的需求,服装私人定制将会成为未来纺织服装行业的主要发展方向,而服装私人定制化的发展,离不开工业机器人技术的支撑。机器人末端执行器作为直接与物体接触的部件,是工业机器人在纺织行业应用的关键。因此,针对服装行业的机器人末端执行器的研究,对我国服装行业的发

学位

机器人末端执行器静电吸附织物建模面料抓取

时变时滞神经网络的稳定性分析

近年来,神经网络已经广泛应用于图像处理,故障诊断,复杂系统控制等各个领域。众所周知,神经网络系统的许多应用很大程度上都依赖于其动力学行为,尤其对于平衡点的存在性和稳定性。而且,在实际的应用中由于放大器的转换速度和信息处理速度有限,导致时滞在神经网络系统中往往是难以避免的。时滞的存在,不仅会使系统的性能降低,而且会导致系统不稳定甚至紊乱。在许多实际问题中,还存在一种不同于传统时间延迟的典型时间延迟,

学位

神经网络时变时滞泄漏时滞LKF稳定性

耦合反应扩散神经网络的衰减同步与衰减H∞同步

最近,耦合神经网络的同步等动力学行为受到了学界广泛关注。在研究耦合神经网络同步现象过程中系统解的收敛速度是一个重要但很难被准确估计的指标。因此,能够准确提供系统解收敛速度的衰减同步逐渐成为研究热点,同时,值得注意的是在现有的可以查到的相关文献中,耦合反应扩散神经网络的衰减同步还没有被考虑过。因此本文研究了多权重的状态耦合以及空间扩散耦合的反应扩散神经网络的衰减同步。接着,本文以现有的衰减同步和H∞

学位

耦合反应扩散神经网络衰减同步衰减H<sub>∞</sub>同步多权重空间扩散

基于深度学习的激光视觉多层多道焊缝跟踪研究

多层多道焊接方式常用于航空航天和船舶制造等工业领域里中厚板工件的焊接,是一种非常重要的连接工艺方法。而基于激光视觉传感器的机器人智能化焊缝跟踪方式以其价格低廉、抗干扰能力强和精度高等巨大优势成为应用最广的方法。然而,在进行实际焊缝跟踪时,利用视觉传感器获取的焊接图像不可避免地会受到强反射、飞溅和电弧噪声的污染导致无法保证焊接的稳定性和精确性。因此,对基于激光视觉的多层多道焊缝跟踪进行研究具有重要意

学位

激光视觉卷积神经网络多层多道焊接特征提取焊缝跟踪

面向约束优化问题的进化算法相关策略研究

在科学研究和工程技术领域,优化问题无处不在,但这类问题往往带有复杂的约束条件使搜索过程复杂化,加大了解决问题的难度。在过去的几十年里,进化算法被广泛应用于求解优化问题。然而,单纯只用进化算法来解决约束优化问题是不准确的,因为它们不能直接减少约束问题的约束偏移。因此,对于约束优化问题,如何能够设计出有效处理约束且能找到最优解的算法即为本文的研究重点。本文主要从进化计算中约束处理技术的角度出发,结合有

学位

约束优化问题人工蜂群算法约束共识策略差分进化算法可行性规则

二阶时滞多智能体系统一致性研究

近几十年来,多智能体系统的分布式协同控制引起了越来越多研究者的关注,其研究方向涉及传感器网络、编队控制、一致性问题、航天器姿态跟踪控制、分布式优化计算和控制工程等各个领域。一致性问题是多智能体分布式协同控制的基本问题,其目标是指一组智能体基于局部交互规则在一定的物理量上达成一致。在现有的研究基础上,本文研究了二阶多智能体系统的一致性问题,主要从以下两个方面展开研究:在实际的多智能体系统中,由于智能

学位

二阶多智能体一致性时滞分割二阶Bessel-Legendre不等式

基于分解技术的进化算法求解大规模优化问题研究

随着科技的迅猛发展,许多工程应用都需要大量的决策变量来解决问题,这种大规模问题的优化将对现有的优化算法提出挑战。由于决策变量的数量较大,所以问题的搜索空间也是巨大的,甚至是无限的,这就使得问题难以入手求解。此外,在这巨大的探索空间中,必然存在着许多伪全局最优值,这些值将影响算法并使其陷入局部最优,从而失去了搜索全局最优的机会。针对大规模问题的优化,通常使用两种优化技术:一是基于分解技术的协同优化框

学位

大规模全局优化协同进化分组优化器计算资源

基于深度学习的视觉问答系统研究与实现

神经网络的发展和大型数据集的增多,以及计算机硬件运算能力的提升,使得基于深度学习的技术在单模态（图像、文字、语音）已经取得的巨大的发展和应用。但是,多模态理解和交互等人类高级认知和推理功能还是很弱。针对这个问题,本文研究多模态交互领域一个极其重要的研究课题——视觉问答（VAQ）。视觉问答涉及图像和文本两个模态的信息,由于卷积神经网络（CNN）和循环神经网络（RNN）分别在图像和文本上的突出表现,许

学位

视觉问答深度学习视觉推理注意力机制推理网络

室内环境下基于深度强化学习的路径规划方法研究

其他学术论文