【摘 要】
:
随着人工智能技术的飞速发展,机器人在工业、农业、科研领域蓬勃发展。以定位、路径规划、路径追踪等导航技术为代表的研究领域成为机器人研究的热点问题。随着机器人执行任务环境的日趋复杂,机器人通过与所处的环境进行交互实时学习进行路径规划,成为新的研究趋势。本课题基于以QL算法为代表的强化学习理论,研究如何通过获得最大累积回报和最优控制规则进行移动机器人局部路径规划问题的研究。针对强化学习收敛速度慢、探索与
论文部分内容阅读
随着人工智能技术的飞速发展,机器人在工业、农业、科研领域蓬勃发展。以定位、路径规划、路径追踪等导航技术为代表的研究领域成为机器人研究的热点问题。随着机器人执行任务环境的日趋复杂,机器人通过与所处的环境进行交互实时学习进行路径规划,成为新的研究趋势。本课题基于以QL算法为代表的强化学习理论,研究如何通过获得最大累积回报和最优控制规则进行移动机器人局部路径规划问题的研究。针对强化学习收敛速度慢、探索与利用两难及危险区域等问题,提出了基于模糊-QL的移动机器人局部路径规划方法。首先针对规划问题设计状态-动作变量,并对其进行模糊化处理;然后设计Q值函数矩阵来存储学习强化值,并根据避障和最短路径的要求构建了奖赏函数;为了平衡探索与利用问题,加快收敛速度,利用?-探索与利用平衡策略、动作选择算法和更新步长改进QL学习过程。经过学习后获得最佳状态-动作对,得到最优模糊控制规则,完成局部路径规划。针对在特殊危险环境下的死锁问题,在模糊控制规则中,还添加了预防死锁的规则,以提高规划效率。针对QL学习过程中状态-动作对访问不彻底的问题,设置了转向规则表。该方法在机器人利用控制规则规划路径的过程中,根据三个传感器的测量距离,设计转向规则,创造更多学习状态-动作对的机会,增加每个状态-动作对被学习的概率,从而提高QL算法的学习效率,使得学习路线更加平稳。最后基于MATLAB设计实验仿真平台。仿真结果表明,在复杂的环境中,基于模糊-QL算法的机器人能够有效避障,加快算法收敛速度,平衡探索与利用问题,能跳出死锁区域,规划出最优或次优路径。状态-动作对访问不彻底问题的解决方案加强了对状态-动作对的遍历学习,优化了路径规划。
其他文献
目的探讨神经保护剂治疗急性脑梗死患者的临床效果。方法以患者入院时间先后为标准将600例急性脑梗死患者分为三组,对照组(200例)患者均给予溶栓、抗血小板聚集等治疗措施,剩
试验结果表明,0.01%芸苔素内酯可溶液剂在玉米苗期6~7叶和玉米喇叭口期施药2次,有效剂量为0.08~0.12 mg/kg,采用茎叶喷雾法,对玉米的营养生长有促进作用,植株生长旺盛,茎秆粗
移动通信已从第一代模拟通信发展到如今的LTE 4G通信,但依然难以满足快速增长的用户量以及高速数据传输要求,因此5G应运而生,在2017年11月中国工信部已公布5G的频段划分,预计在2020年实现正式商用。天线作为移动终端的重要部件,为实现移动终端多网络通信制式兼容,需要覆盖更多的频带和更宽的带宽。在满足使用功能之外,用户对设备的外观也提出了较高的要求,设备的金属边框、全屏化都使天线所占据的面积被
<正>显微根尖手术行原发性牙根纵裂牙的保髓保牙治疗可行性初探黄定明,四川大学华西口腔医院教授、主任医师、博士生导师,牙体牙髓科主任,中华口腔医学会牙体牙髓专委会常委
介绍3#汽轮机调节系统负荷异常波动原因分析及处理,并对调节系统进行全面检查调试的过程.
目的:对糖电解质类输液产品的生产线建立科学有效的清洁验证及清洁检测方法,保证清洁效果,避免药液交叉污染。方法:以混合糖为电解质糖类的代表产品,确定活性成分中总有机碳和
选取2009—2011年广西对外贸易和广西GDP的时间序列数据,经过基于VAR模型的协整分析、脉冲响应分析和方差分解的有机结合进行研究,发现这些序列间存在长期均衡关系。实证结果表
JavaScript目前已经成为交互式网页和动态网页中广泛采用的技术,JavaScript恶意代码产生的攻击类型也变的多种多样,已经成为加密勒索病毒、脚本挖矿病毒、钓鱼网站、垃圾广告等攻击类型的载体。本文通过对大量JavaScript恶意代码的相关特征进行分析,并针对混淆恶意JavaScript代码进行特征提取与归类,从基于属性特征、基于重定向特征、基于可疑关键词特征、基于混淆特征、基于运行函数特
党员干部作为为人民执政、行使公共权力的公仆,应当树立正确的权力观。因此,从践行党的宗旨、严以用权和加强党性修养三方面论述了树立马克思主义权力观对党员干部的重要性。
随着计算机技术的飞速发展,目标追踪已经成为图像处理领域中不可或缺的一项重要技术。基于形状的匹配算法是计算机视觉领域里最具代表性的方法之一。它从待识别图像中提取若