基于HPSO与强化学习的巡查机器人路径规划研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:alecsuss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,机器人得到越来越广泛的应用。路径规划是机器人研究领域的一个重要课题,特别对于复杂动态环境下障碍物的处理是动态路径规划的一个重要问题。粒子群的优化算法在解决路径规划问题上具有寻优精度高,收敛速度快的优点;Q学习算法在动态环境下具有很强的自主学习能力,通过直接估算状态-动作对的值函数Q(s,a)来快速获得最优策略?(9)。本文将两种算法有机融合来解决复杂动态环境的路径规划问题。本文提出了结合全局静态和局部动态环境的IHPSO-Q动态路径规划算法。首先在粒子群算法中引入健康度概念,通过粒子在迭代过程中的震荡数与停滞数来识别粒子群中的懒惰粒子,避免算法陷入局部最优解,再用接近最优解的引导因子更新懒惰粒子的位置与速度,提升粒子群整体的健康度,加快算法迭代速度,规划出全局路径。其次,定义了机器人行进方向的动作集合A,通过BOX离散方法得到机器人与障碍物之间风险度量的状态集合S,将连续的环境信息离散化做为算法的有效输入信息,设计Q值矩阵用来记录机器人当前环境下面临的周边状态与下一步的决策动作之间的预期奖励值,并且通过加入回溯法使后续巡查机器人动作学习过程所产生的影响能够快速传递给当前状态,使Q值传递的滞后性得到改善,更新规则更加合理有效。第三,机器人在全局规划路径的巡查中,将巡查机器人的运动基于优先级分解为导向与避障两种行为,周围环境没有障碍物时以全局规划路径为导向,当探测到障碍物时,以避障行为优先,对Q值矩阵进行实时计算,并根据预先定义规则确定奖励值,由此选择执行新动作的策略。机器人通过对动态避障的强化学习,构建成一个动态路径规划的最优策略模型,支持机器人的智能巡查。最后在MATLABR2016a实验平台上进行仿真实验,通过八个CEC标准测试函数测试表明,本文提出的IHPSO-Q算法在寻优时间、收敛速度、抗干扰能力及最佳性能指标上相比于传统HPSO算法都有所提升,IHPSO-Q算法比传统的Q算法迭代次数更少,收敛效果较好,达到了研究目标。
其他文献
随着全球经济与股市的快速发展,股票投资成为了民众们常用的理财方式之一。量化投资的出现为投资者们了提供新的投资工具,其凭借纪律性、准确性、时效性和系统性等优势,让其逐步从机构投资者向个人投资者中普及。近年来,随着人工智能技术飞速发展,机器学习被越来越多的学者运用到了量化投资研究中。本文使用2013年1月1日至2019年12月31日沪深300所有成分股数据为研究对象。其中,采用2013年1月1日至20
当前的大学英语四六级阅读理解可以作为一种独立的语篇类型进行研究,运用语篇理论对其研究并提炼出相应的语篇模式,可以更好地促进《大学英语》的教学水平和学生英语阅读能力
<正>课堂上发生的寻常小事成为教师们的教研话题老师提问,学生举手回答问题,回答正确,老师给以肯定和鼓励,这些在日常教学中都是约定俗成、习以为常的。这些是不是就一定符合
近年来,生物治疗已被视为肿瘤治疗的第四治疗模式,其主要是免疫治疗,已成为目前肿瘤治疗研究的热点。目前胃癌基因治疗还主要处于研究阶段,临床应用的主要是免疫治疗,免疫治疗的首
多发性皮肌炎是一种自身免疫结缔组织病,主要累及横纹肌伴同多种皮肤损害,了可伴发多种内脏损害,本文通过病临床表现,治疗用药及转归预后的探讨,分别论述了病情不同进展的护理措施
期刊
摩机界盛事东邪谁属2009年8月15日上海,摩机界风云再起,三诺第二届摩机大赛上海站颁奖典礼顺利举办。三诺集团电声总监张谦、三诺科技发展有限公司市场部总监王念东等主办方领
高桩码头是建造在软土地基上的主要码头结构形式之一。本文主要结合工程实例介绍了如何降低抛石棱体施工对高桩码头水平位移的影响,并分析了抛石棱体对高桩码头水平位移产生不
经典著作里有大量原创性工作和著述,正延续了人类发展中一些不变性的问题。通过阅读经典著作,读者就可以随时和大师进行穿越时空的思想对话,从而实现素质的提高和境界的提升。为
页岩油作为非常规油气资源体系的重要组成部分,近年来已经成为油气勘探开发的热点。页岩储层属于低孔低渗透的致密储层,储层微观结构复杂、渗流机理复杂、自然产能低或根本没