社会困境下形成个体分工的多智能体深度强化学习模型

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:xcn1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用深度强化学习的单个智能体已经能解决诸如复杂棋类游戏的决策问题,然而现实生活的许多决策问题还需要多个智能体协同合作才能完成。这类多智能体决策问题往往存在个体与群体之间的收益冲突,设计能解决这类冲突的多智能体决策算法是目前深度强化学习的热点研究问题之一。群体决策过程中,群体内个体往往会形成特定的分工。然而,当前对于群体内的个体是如何形成分工的机制还不清楚。因此,本文将基于深度强化学习,研究当智能体处于某类冲突——社会困境时,群体内的单个智能体形成特定分工的影响因素,从而提出一个基于满足度的多智能体强化学习算法。本文的主要工作和成果如下:1.设计了一个具有社会困境特征的决策任务。决策任务模拟了人类社会中自然资源与废弃物的动态变化过程。智能体在该决策任务中需要对采集资源和回收废弃物之间进行权衡。智能体持续采集资源而忽视了回收废弃物,则废弃物的增长将挤占资源的生长空间,导致智能体整体收益受限;而智能体持续回收废弃物其个体收益受损,但任务空间的其它智能体将受益。具备这类需要权衡的决策任务表现出类似社会困境的特征,该特征可以看作是一类“囚徒困境”。通过设计智能体深度强化学习算法,验证了该决策任务能够模拟个体与群体间利益冲突的现实社会困境。2.提出了基于满足度的多智能体分工合作策略算法。基于深度强化学习的策略算法,提出多智能中的每一个个体需要引入满足度这一度量,才可以在一个决策任务空间设计智能体的策略,以平衡智能体间个体和群体的利益冲突。尤其是,当智能体间满足度存在异质性特点时,智能体间能形成显著的分工。仿真实验还表明,智能体的视野大小和不同初始位置也会对智能体形成分工产生影响。本研究基于现实的社会困境环境,设计了个体与群体间利益存在冲突的决策任务,提出了求解该决策任务的一个基于满足度的多智能体深度强化学习策略算法。未来的研究方向是将该算法应用到诸如无人机协同合作等实际的工程应用中。
其他文献
随着科学技术的进步和发展,智能生活和生产逐渐走进了人们的视野,相关的技术受到了广泛的关注和研究。图像和视频作为生活和生产中触手可及的信息和数据,常常被用于处理各种
人类对土地资源的开发利用改变了地表覆被,致使土地生态系统的质量状况起伏波动,内部架构日愈紊乱,土地生态系统服务价值也出现地域层面的差异。在西咸一体化建设的背景下,素
随着视频信息量的激增与机器视觉的快速发展,人们对视频处理领域的技术要求越来越高。视频行为识别作为视频理解方向的一个分支,具有十分重要的研究意义。该文对视频行为识别算法做了详细研究,旨在于通过对视频时空信息的分析,形成更加有效的视频特征,得到更有判别力的视频行为识别系统。首先,设计了基于时空卷积网络的视频行为识别算法,将视频行为识别处理为单独对视频空间与时间信息的获取。在双流卷积网络的基础上,比较分
提起印度农业发展,无论是对印度稍有了解的普通读者还是专业学者首先想到的都是“绿色革命”,而大家对“绿色革命”后印度农业的走向则关注较少。轰轰烈烈的“绿色革命”并没
近几年人工智能、大数据等移动互联网新一代技术的发展和兴起,使得人们的生活也走进了智能化的时代。移动互联网技术给生活带来便利的同时,也带来新的挑战,僵尸网络、恶意软
人类视觉系统经过长期进化,形成了选择性视觉注意机制,该机制能够快速的从海量的视觉信息中提取出感兴趣的区域。显著性检测算法通过模拟视觉注意机制,对视觉场景或图像中的感兴趣区域进行预测和提取。色觉检查图依据人眼色觉感知原理绘制而成,能够很好地模拟人眼在自然环境中受到的刺激,且背景复杂,干扰因素较多。已知的算法大都存在生物依据不足、检测精度不高等问题,在对色觉检查图中的标准图案进行提取时尤为明显。对此本
随着我国大力发展“一带一路”战略,“21世纪海上丝绸之路”受到越来越多的国家与地区的重视,水上交通日益繁忙。船舶开始向高速化和智能化方向发展,无人水面艇的自主航行避
手机开发项目涵盖了多学科、跨职能的协同设计与系统集成工作,在业内普遍采用了瀑布式的研发流程,通过对阶段性交付成果设立评审点来批准每个阶段的准入与准出,从而确保项目
粒子群优化算法作为群智能优化算法的典型代表,较其他群智能算法而言有参数简单、易于实现、收敛速度较快等特点。但粒子群算法也存在着陷入局部最优的问题,针对该问题,引入了两种改进思路,研究了四种改进算法。通过标准测试函数对算法进行基本性能检验,最后将改进算法用于多阈值图像分割,同时与原算法进行了对比仿真实验。该研究的主要工作如下。首先,为了防止全局最优粒子(gbest)对于其他粒子的过度影响,将粒子的维
随着我国经济的快速发展和现代化程度的不断提高,我国的公路建设进入到一个新的阶段,道路标线也成为公路建设中的重要部分。由于我国的公路筑养路机械发展处于滞后现状,道路