【摘 要】
:
救援机器人是当前机器人与多智能体系统研究中的一个新兴领域,它涉及机器人学、人工智能、智能控制、计算机视觉等多个领域并且有现实意义。协作模型系统作为整个救援机器人
论文部分内容阅读
救援机器人是当前机器人与多智能体系统研究中的一个新兴领域,它涉及机器人学、人工智能、智能控制、计算机视觉等多个领域并且有现实意义。协作模型系统作为整个救援机器人系统的核心,决定了机器人间的协调协作与运动规划,是机器人的“大脑”。因此,协作模型系统的研究在多机器人、多智能体领域具有十分重要的意义。本文以救援机器人RoboCupRescue仿真系统为研究对象,针对传统的协作模型很难满足多智能体系统在反应性、适应性、智能性和学习能力等方面的要求,提出一种基于状态预测的多智能自协调两层协作模型。该模型把决策系统分为上下两层:中央决策层和行为层。上层中央决策层采用Q学习分别进行状态预测和阵型规划决策,并针对状态预测和阵型规划的特点和要求分别对Q学习的结构进行了合理的改进。针对普通Q学习在环境状态复杂的情况下收敛速度较慢的缺点,通过分析RoboCupRescue仿真系统的特性,分别采用世界状态属性精简的方法和模糊聚类的方法把数量众多的系统状态转化为为数不多的精简状态和模糊状态,从而大大减少了Q学习的状态空间,提高了算法的收敛速度;同时,针对普通Q学习算法易收敛到局部最优,本文通过分析Q学习算法中三个关键参数(学习率α、折扣因子γ和温度值T)的作用,提出一种自适应Q学习算法,动态地调整这三个参数,从而实现系统全局最优动作。下层行为层,取代传统的机器人作为上层意图的简单执行方法或单纯的对外部世界做出反应,充分利用移动机器人的行为特性,提出一种行为效用评估算法对上层决策意图和自身的反应式策略进行行为效用预估,从而选择出最有效的行为方式。继而基于RoboCupRescue智能体的特殊结构,提出一种基于改进栅格法的蚁群算法,进行最佳行动路径规划。该行为层的设计减轻了中央决策层的决策任务,提高了系统的实时反应性。本文采用JaVa编程语言在Linux下编写决策程序来实现整个协作模型系统的设计。通过在RoboCupRescue救援机器人仿真平台上进行仿真比赛,验证了所设计模型的有效性。
其他文献
无线射频识别(RFID)中间件是介于前端读写器硬件模块和后端数据库与应用软件之间的重要环节,它是RFID应用部署运作的中枢。论文对RFID中间件技术的概念、范畴和系统框架结构
血氧饱和度指血液中氧合血红蛋白的含量占血红蛋白总量的百分比,人体组织血氧饱和度是指局部组织中各种微血管中血液的氧饱和度综合值,反映局部组织的氧合情况。无损、持续和快
光伏发电的不稳定性和高成本一直制约着光伏储能微电网的发展,同时高品质电能需求的增长和分时电价政策的普遍实施,为光伏储能微电网的电能分配提出了新的挑战。因此,光伏储能微电网运行优化问题逐渐成为当前的研究热点。本文研究的光伏储能微电网系统由光伏发电单元、蓄电池、配电网、并网逆变器、双向逆变器和用电负载组成。在系统部件特性分析的基础上,基于分时电价政策,考虑光伏输出功率与用电负荷的随机性,在建模方法、模
塑壳断路器属于保护类电器,如果它的可靠性不高,尤其是瞬动保护可靠性不符合生产和生活的需要,会给用户带来很大的影响,甚至造成严重的经济损失。塑壳断路器的可靠性研究是国内外
交互的实时3D分布显示技术中的一个重要问题是如何能在减少系统开销和资源浪费、降低成本的基础上,简单、高效地实现多计算机的同步控制。
本文根据多机多显系统的设计需
智能交通系统是目前公认的能全面有效地解决交通运输领域,特别是交通拥挤、交通阻塞、交通事故和交通污染等问题的最佳途径。交通流诱导系统是智能交通系统的核心研究领域和避
钢铁工业是国民经济的支柱产业,也是国民经济发展的命脉。在钢铁生产加工过程中,质量管理、计划管理、调度管理、订单预测等都是工程研究的重点和难点。炼钢-连铸是整个钢铁生
目标跟踪技术现今已被广泛应用于军事防空系统、战场监视,民航空中管制,汽车导航等领域。随着精确跟踪定位需求的增加,以及各类高速、高机动飞行器的不断涌现,目标跟踪技术的
预测控制是一种基于模型的计算机控制算法,是20 世纪70年代发展起来的一种新型控制算法,它克服了现代控制理论在工业生产过程中的诸多困难,是面向实际工业过程发展起来的一类先
在卷绕系统的自动化生产流水线上,经常由于各种原因导致卷筒材料的横向跑偏,不能保持直线运行,如果不及时纠正,就会直接影响产品的规格或质量,造成不必要的经济损失。例如在