基于进化免疫系统理论的多机器人协作和机器人目标探索研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:elongyu999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多机器人系统中建立协作机制是非常重要的,这些机制可以使一组机器人自治地产生协作行为。研究人员之所以对机器人协作问题产生兴趣主要是基于以下原因:某项任务可能太复杂以至于单个机器人无法完成;与使用单个大而复杂的机器人相比,使用若干个结构简单的机器人将具有更好的柔性和容错性能,而且成本更低.智能控制代表着更为广义的控制概念,它涉及到机器/机器人与环境的交互作用。智能控制系统特别能够胜任如下任务:在分层式控制体系的不同层级上进行行为规划;依靠以往的经验进行学习;识别各种威胁系统正常运行的因素(如故障)并正确地做出反应;等等。现有的规划系统、专家系统、模糊系统、神经网络、独特型免疫网络、机器学习以及故障诊断等都是与智能控制紧密相关的一些重要研究领域。随着工业制造领域机器人数量的不断增加,科技人员经常面临这样一些问题:如何让生产车间中的多个机器人能够协调协作,如何让每个机器人都可以实现行为自治。因此,多机器人之间的协作、任务分工、通信以及导航成为机器人学、力学、传感器技术以及智能控制等相关领域需要解决的关键问题。目前,在群机器人学领域的主要挑战是如何建立更有效、更适用的控制策略去解决这些关键问题。为此,本文重点研究了可应用于机器人学的免疫进化计算方法(Evolutionary Immune Computations,EICs)。免疫进化计算是受生物免疫系统工作机理启发而建立的一种全新进化算法。本文所做的研究可以说明如何探索和研究一个生物系统,以及如何从生物系统的运行中得出可应用于多智能体(多机器人)的推论。在我们的研究中,生物免疫系统的某些机能(如B细胞和T细胞在胸腺中的协作,克隆选择和抗体增殖,免疫记忆/二次免疫应答,以及Jerne的独特型免疫网络等)被萃取出来并应用于多机器人智能体的研究中。以上述免疫特征为基础,本文重点研究了以下五个问题:(1)多智能体系统及其特点;(2)基于独特型免疫网络学说的多机器人智能体之间的通信及协作方法,当多个机器人协作搬运物体时,这些方法可用于机器人准确探测出任何一个具有规则形状或不规则形状物体的重心;(3)基于进化计算技术的机器人性能改进方法,例如采用进化的T淋巴细胞(Evolved T-lymphocyte,ELC)来代表机器人的传感器/探测器;(4)基于免疫系统遗传算法(Immune System GeneticAlgorithm,ISGA)的机器人鲁棒控制方法;(5)利用Simulink软件实现对机器人鲁棒控制进行仿真实验的方法。首先,我们以多机器人协作搬运物体为例,对上述问题进行了研究。通过协调协作,多个机器人可以将空间中一个具有任意形状的物体从一个位置搬运到另一个位置,搬运过程在数学上可以通过物体重心的位移轨迹来描述。其次,我们将研究工作延展到一个称之为“机器人目标探索”(Robot Goal-Discovery,ROGODIS)的工业问题。在这个问题中,要求一个机器人单独对一个有限大小的区域进行探索,找到一扇满足条件的小门并将目标物体放入其中。整个过程要求机器人避开所遇到的障碍物并成功地找到小门。以下是对这两项研究工作的详细介绍。目前,许多可用于物体探测的多机器人控制系统都是基于集中式控制的思想设计的。虽然相对来说其实现比较容易,但由于集中式控制的计算量和通信量都比较大,从而使得这类系统的应用效果和应用规模受到制约。并且,集中式控制也不适合用于多机器人的协调协作。在多机器人协调协作中,遇到的主要挑战(问题)是系统中的信息是分布式的。依靠良好的通信机制实现高效、可靠的信息共享是多机器人协作成功的关键。为此,本文建立了基于自然免疫系统工作机理的多智能体系统体系结构,并将人工免疫系统应用到多智能体系统中作为智能体的计算智能。这种体系结构在免疫系统和智能体之间建立了一种类比关系,它将免疫系统机理应用到多智能体系统中,采用分布式方式去实现全局目标。我们建立的这种策略已被成功地应用到多机器人协调协作物体搬运问题中。在这个问题中,我们采用仿真方法建立了一组机器人,它们利用自组织方式协作探测被搬运物体的重心并完成对物体的搬运,整个过程完全采用交互式机制而没有采用任何集中式控制机制。为了采用自然免疫系统机理在机器人之间实现交互式机制,我们在免疫系统与多机器人系统之间建立了以下对应关系:第一个是机器人与B细胞之间的对应关系。在物体搬运问题中,一个机器人代表一个B细胞。怎样探测一个物体并确定其重心,每个机器人都会生成它自己独特的行为策略。机器人所做的工作类比于抗原(Antigen,Ag),这里抗原代表物体。第二个是物体与抗原之间的对应关系。我们使用了一种称为“多化合价、多抗原决定基”的抗原(Multivalent and Multi-determinantAntigen,MVMD-Ag),它具有多个抗原决定基。在免疫系统中,这种抗原能被几种不同的B细胞识别。所以,相同的抗原能被几个细胞记忆识别。在本文中,每一个由机器人探查的物体都采用一种称为物体抗原(Object-antigen,OAg)的新型计算特征量来表征。第三个是交互式机制实现途径与免疫网络之间的对应关系。免疫网络被用作机器人之间进行交互的模式,机器人之间的通信方式采用独特型免疫网络的工作机理加以实现。第四个是关于B细胞(机器人)激励水平的计算。一个机器人(B细胞)受到的激励越多,则它采用的行为策略被认为越好。如果一个机器人的激励水平较低,那么它将因为所采取的行为策略较差而受到抑制(淘汰)。相反,如果一个机器人总是能得到良好的激励,说明它的行为策略优秀而将予以保留。为了计算B细胞(机器人)的激励水平,本文提出了一种新的计算方法,它包括如下步骤:建立激励函数,建立亲合力函数(激活阈值),克隆B细胞,B细胞成熟过程,免疫记忆(包括记忆应答和血浆应答)以及建立B细胞抑制函数。这里,B细胞的克隆机制被用来表达信息在机器人之间的传递。基于这些步骤,一个机器人通过与相邻的其它机器人及环境的交互作用而得到激励。如果一个机器人正在执行任务,那么它就会得到更多的激励。而如果这个机器人受激励程度很高,那么它就会产生克隆B细胞,其中包含该机器人所执行任务的信息。为了评估和改进每一个机器人的性能,我们采用了遗传算法(Genetic Algorithm,GA)进化T林巴细胞(T细胞),使其能更好地适应给定的任务。在我们的研究中,进化的T林巴细胞被用作为机器人的传感器以探测物体的重心和运动方向。每个拥有一个进化的T林巴细胞的B细胞(机器人)都能获得任务所需要的能力和性能。这些能力和性能,一方面可使B细胞(机器人)能够非常准确地探测到被搬运物体的重心;另一方面,根据作用在物体上影响物体移动的作用力,它们又可以确定机器人的运动规则。我们已经采用这种策略通过仿真实验实现了多机器人协作搬运形状规则的物体和形状不规则的物体。在本文中,我们还建立了一种适用于任何形状物体重心计算的通用方法。实验结果表明,采用这些策略和方法,机器人之间的协作更灵活、更有效、更容易实现而且搬运时间更短。这也证明了交互作用、信息传递和高端能力的获取可以使一组机器人涌现出协作行为。导航、运动规划及自治小车/自治机器人控制都涉及到选择几何路径和机器人运动速度的问题,目的是使机器人在动态环境中避开障碍物并极小化某些代价函数,如时间或能量。速度选择错误可能会导致机器人迷失方向,或浪费时间或能量,更坏的情况甚至可能会使机器人的控制系统变得不稳定。依靠进化理论,许多困难的控制问题现在已经非常容易解决。尽管某些模型对于静态环境中的机器人导航是有用的,但将它们应用到真实的动态环境中时其鲁棒性会变差。以前期其他研究人员的工作为基础,我们对这个问题进行了进一步的研究,提出了一个在动态变化的环境中具有更好鲁棒性的策略。我们的目的是通过在不同抗体率下抗原之间的协作/竞争在B细胞网络中创造出一个更好的涌现行为(这里,抗体多时,抗原之间是协作关系;抗体少时,抗原之间则表现为相互竞争关系)。为此,我们已经建立一个新策略,它包括三个研究阶段。第一阶段使用人工免疫聚类算法(Artificial Immune Clustering Algorithm)和克隆选择原理(CloneChoice Principle)以获取一对抗原,这里,人工免疫聚类算法以适用性免疫网络理论(Adapted Immune Network Theory)为基础,用于抗原的交互-协作-竞争。每对抗原在“机器人目标探索”问题中用于代表小门的两个边框。第二阶段使用一些抗体,用它们决定移动机器人传感器的转向角。第三阶段研究基于动态环境下的运动规划和自治机器人控制问题的免疫原则。然而,当使用进化技术解决动态环境中的问题时,需要克服传统进化算法的某些固有限制,如种群的多样性保持。此外,当处理一个移动机器人系统的稳定性问题时,强收敛性可能是有疑问的,因为许多进化方法(如GA)不能有效地匹配运动控制算法。为了解决这些问题,对于上面的第三个阶段,本文提出了:(1)一种免疫系统遗传算法(Immune System Genetic Algorithm,ISGA)以获得决定一个移动机器人运动控制的最佳控制参数。所提出的这种新算法被称为基于免疫系统的遗传算法(Immune System-based GeneticAlgorithm),其所用到的主要技术有:基于人体(自然)免疫机制的基因库进化,基于人工免疫系统机制的基因库进化,肉体超变异/生物转化,以及记忆B细胞(免疫二次应答)等。这些进化技术被转换并植入到标准遗传算法中以改进其多样性保持能力。ISGA算法用于进化在机器人鲁棒运动控制器中所使用的控制参数,以使机器人的运动时间和路径最短、能耗最低。(2)实时仿真实验环境的描述方法。这些实验测试的是不同参数(如变异率、交叉率及超变异算子)对控制系统性能的影响。(3)以自然免疫系统二次应答机制为基础、用当前所获得的更快更强有力的反应去记忆过去事件的能力。针对单个机器人执行特定的目标探索任务,仿真实验已经论证了机器人能够获得成功完成任务所必需的基本探索和目标发现技能,机器人所涌现出的行为具有智能性、自适应性、柔性及自我调节能力。为了使我们的工作更加接近于真实情况,以验证运动规划和自治机器人控制的正确性,我们假定一个机器人在一个二维平面上运动,在该平面上定义了一个全局笛卡尔坐标系统。这个机器人具有三个自由度,用一个时间向量p(t)代表它在笛卡尔坐标系统中的位置和姿态。机器人的运动受其线速度ν和角速度ω控制,它们都是时间t的函数。机器人的运动学模型由Jacobian矩阵J(θ)定义。本文所建立的数学模型(包括运动学模型、动力学模型、通信模式、控制模型等)使我们能够在Simulink环境下对一个自治式机器人进行运动控制仿真实验。尽管存在各种与环境相关的约束和干扰(如摩擦、滑动、障碍物等),仿真实验仍可在少于1分种之内被完成,这说明免疫系统遗传算法ISGA具有良好的快速性、稳定性、鲁棒性并且能够非常有效地控制机器人的运动。本项研究的最终目标是建立多机器人学习和增强自适应能力的更有效方法,在许多领域普及协作型机器人的应用,从而推动多机器人系统在现实世界众多领域中的实际应用。
其他文献
我们已进行'幼猪先天性心脏病、室间隔缺损、肺动脉高压'的动物模型手术20余例.手术麻醉选择气管内插管全麻,术前按常规进行各种准备.20余只幼猪的麻醉中有两例插管
山区小学实施语感教学,十分困难,山区小学生所处环境不同,导致接受能力有较大差异,语感是人类在长期的、规范的言语活动中形成的对语言文字的直觉的、正确的理解能力和感受能力的
作为我国高等教育中的一项重要政策,合理利用奖学金可以帮助贫困学生完成学业。奖学金政策对高校学生的身心健全发展和学业进步都提供了坚实得物质基础。但是如今奖学金制度
针对大型电力变压器在短路状态下线圈稳定性问题,建立线圈的三维立体计算模型,采用空间梁单元,用有限元方法分析了线圈空间失稳的各阶临界载荷与失稳模态.
受国家教育部的委派和加拿大不列颠哥伦比亚大学的邀请,我于2003年9月1日,以访问教授的身份来到了加拿大美丽的城市温哥华,开始了为期六个月的学术访问.我访问的主要目的是学
根据Willis定理,设计出计算机仿真程序,由非对称齿轮滚刀齿形自动生成非对称齿轮齿形,并用AUTOCAD绘制齿形图。根据该齿形图修正滚刀设计,直到齿形满足设计要求为止。
针对现代工业大型复杂系统的不确定性使得对其进行建模比较困难的特点,提出了一种用神经网络进行传感器故障诊断的方法.以凝汽式汽轮机调速系统中的转速传感器为例进行了传感
本文报道了用含甲基睾丸酮(MT)30和60μg / g剂量的载药饵料饲喂6日龄大瓶螺(Ampullaria gigas Spix)6天,雄螺百分比分别为46.2%和56.3%。统计学检验显示对照组与30μg / g剂量组
4月27日上午9点,一阵警铃过后,位于齐河县的山东莱钢永锋钢铁有限公司专职消防队拉动演练正式开始。该企业假设燃气车间煤气管道泄漏起火,30多名专职消防队员接到报警后,迅速展开
报纸
本文介绍了职业技能测试项目如何确定、对学生如何进行职业技能测试,对测试结果如何进行分析以及职业技能测试留给了我们哪些启示.