基于强化学习和群集智能方法的多机器人协作协调研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:Susan616
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多机器人系统的迅速发展,21世纪伊始就对其提出了分布、智能和协同化的要求。合理体系结构和高效协作协调算法的研究重要性日益突出,本文对这两方面进行了全面深入地研究,内容分为三部分:多机器人系统体系结构研究;多机器人系统强化学习算法研究和多机器人系统群集智能算法研究,以满足多机器人系统的低通讯量,变化性,分布性,分散性和动态性的要求。 体系结构是多机器人系统的研究基础,直接决定了机器人间的相互关系和功能的分配。本文面向多机器人系统强化学习算法,设计了多机器人分层体系结构。给出了势场栅格算法,研究了模糊控制算法和黑板式通讯。这种结构的并发性好,实时功能强,能够加强机器人对变化环境的应变能力。面向多机器人系统群集智能算法,提出了多机器人意图-行为结构,对这种结构,对各机器人的行为能力和群体交互方式进行了研究。探讨了基于对策论的无通讯协调,给出了愿望竞争算法、抑制疲劳算法,研究了机器人行为设定机制和基于信息素的通讯机制,得出该结构具有分布式控制和分散的数据量的特点的结论,这适合于相似的分布式控制系统。 强化学习理论由于其自学习性和自适应性的优点而得到了广泛地关注。但此理论在应用中还存在着状态空间压缩,结构信度分配等问题。本文面对状态空间压缩问题,提出自组织动态压缩空间算法;关于结构信度分配问题,提出兼顾系统整体利益和个体利益的内外强化信号算法,对传统强化学习算法进行了重大改进。这种状态空间压缩方法加快了算法对空间的遍历,提高了算法的学习速度;合理分配信
其他文献
企业社会责任是企业在创造价值、对股东承担法律责任的同时,还要承担对公司、员工、顾客、供应商、政府部门、社区和环境的责任。企业社会责任要求企业必须超越把利润作为唯
铜绿假单胞菌(pseudomonas aeruginosa,PA)是一种非发酵革兰阴性杆菌,广泛分布于自然界中,在水、空气等潮湿的环境中易于滋生和繁殖,因此,很容易污染医院器械和环境而造成感染。同时
摘 要:在小学数学教学过程中,教师要结合低段小学生的认知特点和心理特征,营造轻松的学习氛围,创新小学数学教学方式,引导学生快乐地学习,促使学生积极参与数学学习活动,亲身体验数学学习的乐趣,提升数学学习的效率。  关键词:小学教学;低段数学;有效性  数学是小学学科中的一门重要科目,数学学习是培养学生良好的逻辑思维,获得数学素养的有效途径。义务教育阶段的数学课程,其基本出发点是促进学生全面、持续、和
目的分析硝苯地平控释片应用于原发性高血压治疗的临床效果。方法选取82例原发性高血压患者为研究对象,采用随机数字表法将其均分成2组(n=41),对照组给予美托洛尔治疗,观察组给
目的建立一种用斯达尔样本工作站提取全血中DNA的方法,并评价DNA的纯度和产量。方法使用斯达尔样本工作站提取全血DNA;DNA的纯度和含量用紫外分光光度法测定,并与手工提取方法进
肾病综合征是一组常见的、多发的免疫性疾病,长期以来使用免疫抑制剂治疗,效果欠理想,其病理生理除免疫引起炎性反应以外,尚有高凝等病理因素对疾病有一定影响。我们采用激素加中
周围神经长段缺损后,临床上首选的方法是自体神经移植。但是自体神经来源有限,并给供区造成一定的功能障碍。目前,解决神经缺损方法的研究集中在2个方面,一方面是研究肌桥、静脉
当今,全球化进程日益加快,我国经济发展正处于“调结构、转方式、促升级”的关键时期,外商直接投资在此过程中扮演着重要角色。FDI利用效率的提高一方面可以转变经济增长方式
财务报表遣假问题一直是股市的毒瘤。纵观会计假账,无不与企业内部控制环境缺陷相关。管理者在控制环境中起着绝对重要的作用。本文从控制环境角度提出预防财务报表遣假的建议