复杂动态环境下移动机器人决策控制问题研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：geniuscaobo

【摘要】

：

【作者】

：

王帅

【出处】

：

中国科学技术大学

【发表日期】

：

2020年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,随着研究的不断深入,移动机器人领域的相关研究已从避障、跟随等简单实验环境下的演示示范逐步走向巡逻监视、协同编队、自动驾驶等真实场景下的实际应用。其所面临的工作环境也从二维结构化的简单静态场景,如扫地机器人面临的室内场景,逐步深入到三维非结构化的复杂动态场景,如无人驾驶车辆面临的城市交通场景等。其中,自主导航技术是支撑移动机器人完成上述复杂任务的核心基础模块。传统的移动机器人自主导航系统通过模块化划分,将整个复杂的自主导航问题分解为定位、感知、规划、决策、控制等多个单一的子问题,进而利用多个子模块分别进行解决,在简化问题形式的同时也便于模块的并行化开发。然而,传统模块化的自主导航方案,特别是其决策和控制模块,面对复杂且动态多变的工作环境,在执行监视围捕、协同编队、自动驾驶等自主性要求较高、任务形式较为复杂的自主导航任务时,其决策的灵活性、控制的实时性以及决策控制策略对任务场景的迁移学习能力存在较多问题,使得此类任务距离实际应用仍存在较大差距。造成传统模块化方案从简单实验场景迁移至实际任务场景时失败的原因,除单机器人个体在感知、机动能力上的固有不足之外,其核心原因主要在于:（1）首先,现有模块化方案中基于固定规则的行为决策方法缺乏与周围动态目标交互关系的建模,仅能处理某些已知的简单场景。而面对未知动态环境下包含多异构个体的任务形式,如监视围捕任务中通常包含监视机器人、可疑目标等多个异构个体,且不同个体间兼具合作、对抗等复杂的交互关系,此时仍旧采用传统基于规则的决策策略很难适应环境的动态变化,造成系统决策的灵活性、自主性较差。（2）其次,面对具有实际应用背景的复杂问题,相关研究倾向于从控制理论的角度对其进行理想化建模,以期保证理论上的完备性,而忽略了实际环境中存在的诸多约束。如在多机器人协同编队任务中,基于经典控制理论的控制方法在应用于具体任务时需要在理论层面之外重新考虑相关约束,导致算法的实时性、环境适应性面临较大挑战。（3）最后,传统模块化的问题分解方式使得决策控制模块缺乏对整体任务指标的清晰认知,且各独立模块间的输出结果难以实现深度融合,造成系统的综合推理能力较差。并且,传统基于模型的决策控制机制对环境的感知理解能力较差,在面对自动驾驶等复杂多变的任务场景时,系统无法通过学习实现模型的场景迁移。为实现移动机器人从简单实验场景到实际任务场景的有效迁移,着重解决传统模块化方案中决策、控制模块在实际任务中存在的诸多限制,本文分别从三种典型的实际任务场景出发,对复杂动态环境下移动机器人所涉及的相关决策控制问题进行了深入研究。具体研究内容如下:（1）针对基于固定规则的行为决策方法缺乏对周围动态目标交互关系建模,导致系统的灵活性、自主性较差的问题,本文以实际场景下的多机器人协同视觉监视围捕任务为切入点,首先利用多个机器人个体,实现了大范围监视场景下的多机器人实时协同感知,克服了单一机器人个体感知能力的不足。其次,基于博弈理论对监视场景下的多个体间涉及的合作、对抗等复杂的交互关系进行了博弈形式建模,并通过综合考虑系统整体任务指标与个体利益指标进行博弈模型的求解,实现了多机器人个体的实时动态决策。最终配合运动控制算法实现了监视场景下对可疑入侵目标的合作围捕。该算法通过构建一整套深度融合的感知、决策、控制算法,克服了传统基于固定相机的视觉监视系统在移动性和自主性上的不足,同时也证明了基于博弈的决策策略在模块化方案中灵活应对复杂任务场景的潜力。（2）针对基于经典控制理论的控制方法应用于实际任务时其算法实时性、环境适应性较差的问题,本文以多机器人编队问题为实际任务背景,首次尝试从数值优化的角度对传统编队控制问题进行重新建模,将编队控制问题建模为非线性优化问题。进一步通过引入非线性优化求解算法并结合传统控制方法,设计了多种具有实际应用背景的多机器人协同编队算法。最终借助于优化算法的快速收敛特性并结合自动化参数搜索,本文提出的协同编队算法能够根据具体场景实时自动调优,提升了移动机器人在实际编队任务中的实时性和环境适应性,同时验证了将优化理论引入传统模块化控制方法对系统实时性的提升。（3）针对传统基于模型的模块化导航方案缺乏完善的输出融合机制,模块间的松散耦合以及对环境感知能力的不足导致系统在复杂环境下的学习、推理、场景迁移能力较差的问题,本文从时空数据驱动的角度对移动机器人自主导航中的决策控制策略学习问题进行了研究。通过构建多种兼具时空信息的策略学习数据集,分别设计了多种基于时空信息的端到端决策控制策略深度学习模型,促进了感知、规划、决策、控制模块的深度融合,增强了自主导航系统在复杂环境下的环境感知、学习推理以及场景迁移能力。基于上述改进和创新,本文分别从博弈决策、优化控制的角度提升了现有模块化导航方案在监视围捕、协同编队任务中决策的灵活性和控制的实时性,从时空数据驱动的角度改进了基于学习的导航方案在自动驾驶任务中的感知、学习和推理能力,为移动机器人在复杂动态场景下完成其他实际任务提供了参考。

其他文献

钙钛矿和油相碲化镉量子点的合成及其光学性质研究

半导体量子点（QDs）与传统的有机发光材料和固体荧光粉相比具有尺寸可调的荧光、较大的光吸收系数、优良的光热稳定性、简单便携的溶液加工等特性,在近十几年来备受关注。QDs的研究对于其在发光二级管（LED）、光伏电池（PV）、生物标记等领域的推广应用具有非常重要的意义。基于此本论文探讨了全无机钙钛矿（CsPbX3）、碲化镉（CdTe）和掺杂钙钛矿(CsPbCl3:Mn2+)这三种QDs的有机相合成及光

学位

绿色交联聚丁二烯弹性体的构筑与性能研究

橡胶是极其重要的国家战略资源,和民生密切相关。橡胶得以使用的关键是硫化,而这在赋予其高弹性的同时,也导致其交联网络的永久固化。因此,硫化交联体系有几个现实问题需正视,如:（1）为追求高性能,硫化体系掺杂有毒物质不可避免。（2）有毒“硫化烟气”在工业化生产中大量排放,致使一线橡胶工人的致癌发病率高于常人。（3）橡胶制品不可生物降解,若长埋于地底,有毒化学物质会渗入自然环境当中。若滋生蚊虫,还有可能造

学位

新型过渡金属催化剂催化烯烃配位聚合的研究

聚烯烃材料是由乙烯、丙烯、各种长链α-烯烃以及环烯烃聚合得到的一类热塑性弹性体材料的总称。由于原料来源丰富,易于加工,性能优良等特点,聚烯烃材料的产量非常巨大且应用十分广泛,其中以聚乙烯,聚丙烯尤为重要。分子量,分子量分布,支化度,支化结构以及主链链结构等的差异可导致聚烯烃材料表现出不同的物理和化学性质。近些年来,烯烃聚合的相关研究和进展在学术界和工业界都引起了广泛的关注。而在烯烃聚合制备新型材料

学位

基于价值链分析的企业战略成本管理研究

为了不断提升企业战略竞争力，成本管理活动作为企业战略管理中的重要着力点，价值链管理思想成为新时期企业管理的重要发展方向。本文将立足价值链对企业战略成本管理展开研究，引入价值链成本管理分析工具，以某商品零售企业Z公司的成本管理为例，根据企业成本管理现状，发现存在成本管理重表面、组织体系不够健全、财务管理部门职能落实不到位、成本管理方法缺乏创新等问题。针对这些问题，基于价值链构建Z公司战略成本管理体系

期刊

淀粉基粒子稳定Pickering高内相乳液的调控和应用

本论文以功能性淀粉基粒子为稳定剂,实现了 Pickering高内相乳液（Pickering HIPEs）的稳定和调控,并在此基础上深入探究Pickering乳液在功能性物质控制释放和多相界面酶催化领域的应用。同时开展了 Pickering HIPEs在循环Pickering乳液聚合体系、材料多孔结构调控、双相凝胶材料的设计和制备等领域的应用研究。论文系统研究并阐述了淀粉基纳米粒子结构及表面性质对P

学位

大豆油衍生物/竹基生物质复合材料的制备与性能

竹材是一种资源丰富、生长周期短、可再生的绿色材料,而大豆油具有资源丰富、价格低廉、分子结构可设计等优点。因此,以竹材和大豆油为原料制备新型生物质复合材料可替代传统石油基产品,是拓展我国生物质资源高效利用的重要途径。本文分别以四种不同形态的竹材增强体,即竹微晶纤维素、竹粉、竹原纤维和竹刨花,以不同工艺制备了大豆油基生物质复合材料。大豆油衍生物（环氧大豆油ESO和环氧大豆油丙烯酸酯AESO）可在复合材

学位

“农转非”、劳动力流动与劳动收入份额

提高劳动收入份额是实现共同富裕的重要路径。基于手工收集的城市层面户籍制度改革数据与微观企业的匹配数据，利用户籍制度改革作为自然实验来研究劳动力市场改革对劳动收入份额的因果效应。研究发现：劳动力市场改革显著增加了企业的劳动收入份额。异质性效应表明，这种正向效应在高创新企业、低融资约束企业、非国有企业、小规模企业、劳动密集型企业和发达地区企业中更为明显。机制检验发现，劳动力市场改革通过破除户籍壁垒显著

期刊

重大基础设施非核强电磁脉冲威胁与防护策略研究

国家现代化建设和运行高度依赖重大基础设施，相应安全问题成为国家安全的核心要素之一；非核强电磁脉冲源生成技术逐步成熟并朝着普及化、隐蔽化方向发展，已成为重大基础设施的现实威胁类别。重大基础设施的电磁安全保障研究成为我国面临的紧迫性、战略性任务。本文以重大基础设施的非核强电磁脉冲威胁为研究对象，明确了概念内涵并凝练了重大需求，梳理了先发国家在本领域所发布的国家政策、产业标准、基础研究、应急管理等举措；

期刊

量价货币调控的效果差异、原因及政策搭配

经历多年的经济下行,我国宏观经济形势和远景目标遭遇空前挑战。2007年末-2021年末,我国GDP增速从接近15%降至4%,宏观经济面临国内投资消费需求不足、国外大宗商品价格走高和潜在经济增速下降的三重压力。GDP增速的继续下滑不利于我国顺利实现第二个百年奋斗目标,也不利于我国跨越中等收入陷阱,甚至还会威胁我国就业形势和社会稳定。2021年中央经济工作会议提出,今年经济工作要稳字当头,将稳增长作为

学位

基于聚多肽和花菁染料的近红外二区光纳米诊疗体系用于抗肿瘤治疗

荧光成像技术在生物医学领域,特别是癌症的可视化治疗应用中有着举足轻重的地位。随着荧光发射波长的红移,特别是到了第二个近红外波段,成像具有明显增强的生物穿透性和分辨率。在众多的近红外二区荧光分子中,有机花菁类染料因其优异的荧光成像性能以及良好的生物安全性而被广泛研究报导。然而,在实际生物应用方面,小分子荧光试剂在生物体内停留时间较短,容易被清除体外。为了实现探针在生物体内的长血液循环,需要借助大分子

学位

复杂动态环境下移动机器人决策控制问题研究

与本文相关的学术论文