多智能体中基于蚁群算法信息素的Q学习研究

被引量 : 0次 | 上传用户:yanglsm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的不断进步,日益复杂的实际问题已经渐渐超出了单个智能体所能处理的范畴,更多大型的实际应用需要很多个智能体共同合作完成,因而多智能体技术得到了愈来愈多研究人员的关注,这项技术也在过去二十多年得到了快速发展。其中,强化学习技术作为多智能体领域一个研究热点,也经历了较大的发展,它能够对多智能体系统搜索最佳解提供解决方案。Q学习是强化学习最主要的学习算法之一。蚁群算法是模拟自然界蚂蚁群体行为的一种群智能优化算法,它通过对真实蚂蚁群体的智能行为研究,进而抽象出理论算法,对处理众多问题带来了新的办法。本文通过将蚁群算法的信息素概念引入到多智能体系统中来实现同Q学习算法的结合,将信息素也纳入到动作指导信息中。信息素的引入让整个系统中的智能体在进行行为决策的时候,不单单依靠环境信息,而是考量信息素和环境因素的综合效应来选择行动,这样就加强了各个智能体之间的信息交互,从而能有效地提高原有算法的学习效率,更好的协作完成目标任务。而对于结合的蚁群算法,针对信息素的更新策略,采用了改进的蚁群算法更新模式。首先对于信息素挥发因子ρ,采用了自适应调整的方式,这样就得到了结合蚁群算法自适应调整信息素挥发因子更新信息素的Q学习(APEF_Q),从而更大的提高了原有算法的搜索能力与收敛效率,最后通过围捕问题模型进行计算机仿真,结果证明了改进后的算法相较于原有算法,在性能上有明显的提高。其次,对于信息素强度,利用动态的时变函数取代原有的常数项模式,这样得到了结合蚁群算法自适应调整信息素强度的Q学习(AP_Q),对于这种改进算法,采用了环境更为复杂的三维空间的围捕模型,通过加大难度的计算机仿真实验对改进的算法进行性能分析。通过与原有算法的对比,有效证明了改进后的算法更为可靠,算法效率也有了较为明显的增强。最后,同样采用难度较大的三维空间仿真模型,对基本Q学习、结合基本蚁群算法信息素机制的Q学习(Ant_Q)以及两种结合改进蚁群算法信息素机制的Q学习(APEF_Q和AP_Q)这四项算法进行了实验对比。通过结果分析可以得出,结合了蚁群算法信息素机制的Q学习,相较于基本Q学习,在性能上有明显的提升。
其他文献
世界经济一体化步伐的加快,世界烟草业的格局和走向将深刻影响长期以来脱离真正市场经济砺练而保守封闭的中国烟草产业,跨国公司在中国实施国际化经营战略必将给中国烟草行业带
正十二烷基磺酸钠是阴离子表面活性剂,其分子式为C12H25SO3Na,作为表面活性剂,形成胶束是它的一个重要特性.本文利用电导法对正十二烷基磺酸钠的临界胶束浓度进行了研究,分别测试了它在不同温
随着新一轮电信行业的重组以及3G牌照的发放,中国电信运营商之间竞争越来越激烈。作为新融合而成的长沙联通面临着前所未有的挑战和机遇,要迎接这种挑战,实现客户市场的“三
随着石化能源逐渐枯竭以及全球生态环境的恶化,再生能源的研究和利用已成为全球关注的热点,目前世界各国都在投入巨资大力研究和利用风力发电及其相关技术。风能作为一种常见
随着科技的进步,知识产权在各个领域都有所涉及,也要求每个企业在此领域承担责任,并分享应有的权利。从长远看来,企业要生存发展,要想在更大程度上参与国际间的竞争,也必须更
对于由创伤、肿瘤以及各类感染而造成的骨组织缺损的修复,一直是临床上的重要课题.人们对骨替代材料的寻找的历史可追朔到一百多年前,从生物惰性材料(如氧化物陶瓷、金属),到
当代大学生正处于身心急剧变化,价值观逐渐形成,人格逐步健全的关键时期,由于社会转型的影响,他们将要面临比以往更严重的社会压力和心理冲突。大学生的心理健康问题日益受到
语言学界对于语言符号的任意性和象似性问题一直存在争论。本文阐述了索绪尔的任意说和基于皮尔斯符号学的象似说的要点,简要回顾了国内外语言学家的对立观点,并从两方面论述
随着现代物理学、空间技术、电子技术、计算机技术、信息科学和环境科学的发展,遥感技术已成为一种先进、实用的综合性探测手段,被广泛应用于农业、林业、地质、海洋、水文、气
伴随着越南文化的开放政策,越南近几年的音乐也开始走向了快速发展之路,在音乐教育、音乐表演等领域都取得了瞩目的成就。但是,作为音乐学理论则发展严重滞后,特别是越南音乐