基于改进强化学习算法的移动机器人路径规划研究

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:liusha5188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对强化学习中的标准Q-learning算法应用在路径规划中存在的计算效率低的问题,提出一种改进Q-learning算法。改进后的Q-learning算法在原来标准Q-learning算法的基础上增加了一层深度学习层并且在算法初始化的过程中加入了关于环境的先验知识作为启发信息,从而避免了学习前期探索的盲目性,有效地提高了算法计算效率。通过与标准Q-learning算法、增加深度学习层的Q-learning算法、引入人工引力场的Q-learning算法、深度双Q网络相比较,改进后的Q-learning算法在小维度的环境下具有更高的计算效率。
其他文献
随着智能无人小车的广泛应用,智能化导航、路径规划和避障技术成为了重要的研究内容。文中提出了基于无模型的DDPG和SAC深度强化学习算法,利用环境信息循迹至目标点,躲避静态与动态的障碍物并且使其普适于不同环境。通过全局规划和局部避障相结合的方式,该方法以更好的全局性与鲁棒性解决路径规划问题,以更好的动态性与泛化性解决避障问题,并缩短了迭代时间;在网络训练阶段结合PID和A*等传统算法,提高了所提方法
广角反射与正常反射的波组特征相比,具有以下特点:A、能量由弱转强;B、为非双曲线同相轴的一部分;C、频率较低。广角反射为川西地区超深层油气勘探提供了新的技术和思路,能针对性的解决深层地震反射能量弱、信噪比低的地球物理问题,本文利用2009年在四川盆地川西地区采集的华南深部大剖面地震资料,对广角反射采集技术和处理技术进行了研究,希望广角反射成像技术能够为四川盆地中新元古界超深层油气勘探提供高品质地震
针对深度强化学习算法在路径规划的过程中出现与所处环境交互信息不精确、回馈稀疏、收敛不稳定等问题,在竞争网络结构的基础上,提出一种基于自调节贪婪策略与奖励设计的竞争深度Q网络算法。智能体在探索环境时,采用基于自调节贪婪因子的ε-greedy探索方法,由学习算法的收敛程度决定探索率ε的大小,从而合理分配探索与利用的概率。根据人工势场法物理理论塑造一种势场奖励函数,在目标处设置较大的引力势场奖励值,在障
钢筋作为混凝土构件的骨架,钢筋间距、钢筋保护层控制相当重要,它涉及到结构安全性,规范要求的合格率要在90%以上。但是钢筋混凝土中钢筋间距、钢筋保护层偏差是一个容易犯错、仅容易忽视的质量通病,尤其是在工后检测即使不合格,通常也由于无法整改(整改只能进行报废处理)而不了了之,若不能解决这个问题,"内实"只是空谈;因此要加强过程控制,杜绝事后整改,从而落实公路梁板预制标准化再提升。依托沙埕湾跨海公路通道
历史小说以历史人物和事件为题材,再现了特定历史时期人们的生活原貌。这类作品既以平民化视角解读了历史事实,同时也兼具小说的表达空间,在刻画人物和历史事件时允许有适当虚构和假设。优秀历史小说的汉译,对于满足历史小说爱好者的阅读需要,丰富国内历史小说研究,促进中西方文学交流,具有重要意义。本翻译实践报告原文选自美国畅销作家玛丽·莫里斯的历史小说Gateway to the Moon(《通向月球之门》)。
改革开发以来,随着中国人对居住环境和中式文化需求的与日俱增,新中式风格的低层住宅项目不断发展。但是,目前很多项目在定位和决策过程中会遇到目标不明确,问题分析不全面,决策者意志主导等问题,这就需要一个科学、可行的方法帮助决策者找到问题、明确目标、解决问题,这种方法就是建筑策划。本文的研究重点就是适用于新中式风格低层住宅建筑策划的具体策略,通过该策略帮助项目决策和定位,指导建筑设计工作。本文的研究内容
目的:探讨急诊重症机械通气患者发生呼吸机相关性肺炎(VAP)的相关危险因素及其预防措施。方法:回顾性分析行机械通气治疗的70例急诊重症患者临床资料,分析急诊重症机械通气患者发生VAP的相关危险因素。结果:急诊重症机械通气患者VAP发生率为34.29%(24/70);单因素分析显示,年龄、机械通气时间、侵入性操作、急性生理学和慢性健康状态(APACHEⅡ)评分、血清白蛋白、意识障碍与急诊重症机械通气
户外运动作为幼儿教育的重要内容,是保证幼儿健康成长的重要环节。幼儿园开展户外活动,有助于幼儿身体素质的提升、良好品格的形成。因此,幼儿教师应当重视户外运动教学。基于此,文章首先阐述了幼儿园开展各项户外运动的意义,然后从材料投放、目标制定、优化指导方式等方面探究了幼儿园开展户外运动的策略,以期为幼儿教师提高户外运动指导质量、全面提升幼儿的身体素质提供一定的参考。
班集体建设项目学习,是以项目制学习为主要形式,以青年班主任为主体,将不同学习组织、学习途径和评价方式融为一体,形成多元学习主体项目、多条学习渠道发展项目、多维视角评价项目的青年班主任专业发展模式。它有利于提高学校青年班主任职业水平,促进其专业成长,从而更好地培养学生养成良好的行为习惯,一定程度上丰富了学校青年教师职业发展培养的理论基础和实践路径。
幼儿教师这一群体一直以来备受社会各界的关注,人们总是赋予幼儿教师各种称赞,可是近年来由于工资少、工作繁琐等各种压力使幼儿教师的职业倦怠情绪日渐突出。教师的质量与素质是影响幼儿成长发展的关键因素之一,我们只有重视解决幼儿教师的这一职业倦怠情绪才能使我们祖国的“花朵”成长得更加茁壮娇艳。本文通过对幼儿教师职业倦怠的具体表现以及提出相应的解决对策的陈述,希望引起人们对这一现象的重视,同时希望该研究能对缓
期刊