多Agent激励学习方法及其在电力系统中的应用

来源 :东北电力大学 | 被引量 : 0次 | 上传用户:xmound
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关于Agent和多Agem系统的研究是一个生机勃勃的具有广泛参与面的研究领域。随着单Agent学习方法的研究成功,人们也将注意力投向了更为复杂的多Agent系统。在很多实际应用中,仅依靠单个智能体可能无法完成任务,或完成任务的效率很低,因此对多Agent系统的研究势在必行。但多Agent系统的内部组织结构远比单Agent复杂,且外部的任务环境更加动态化,所以对该领域的研究极具挑战性。 本文工作主要集中于Agent间的协作、协调和协商等问题,所要解决的问题是如何使Agem自主掌握与其他Agent交互的技巧,并同时兼顾自身利益和整体利益等问题。在随机对策的框架下,将激励学习与对策论相结合,使Agem通过对各种对策形势的学习自动掌握与其他Agent交互的技巧。在单Agent Q.学习和其他多Agent激励学习基础上提出了一种有效的激励学习算法,在方格世界和追踪领域的仿真实验表明该算法的高效性,且具有一定的通用性,同时将多Agent激励学习的研究从Markov环境扩展到非Markov环境中。进一步将量子搜索思想用于多Agent激励学习的状态空间和行为搜索上,寻求不同于传统行为选择方式的新途径,充分利用了量子叠加性,提高了多Agent激励学习的并行性,仿真实验显示这种量子搜索思想与多Agent激励学习结合的学习算法具有较好的收敛性,这为今后这方面更加深入的研究做了前期工作 本文利用Agent技术来研究我国电力市场中,发电公司在面对不同市场环境下的报价决策问题,提出了基于多Agent激励学习方法的电力报价策略方法,以此来确定最优的投标报价。
其他文献
随着金融业市场的不断发展,各银行在扩展金融服务产品和服务渠道方面的竞争愈演愈烈,纷纷推出和建立自己各具特色的服务产品和渠道,以增强与提高自身的服务水平。 由于银行对
本文针对计算机辅助设计系统AutoCAD旧版本中“光照”模型的易用度不佳,使得用户创建、编辑“光源”十分困难的状况,经过对计算机辅助设计系统AutoCAD原有“光照”模型的研究,提
计算机图像处理在医学领域的应用越来越多,应用较多的是医学细胞图像的自动判读。在白细胞显微图的自动识别系统中,白细胞的检出是最重要和关键的一步。它的准确性和稳定性直
通过医学图像建立特定个体的精确心脏左心室三维模型,再根据该模型分析左心室的运动状态、评价心室功能参数已成为目前的研究热点。基于精确的心室模型进行的力学分析可以有
定性映射(Qualitative Mapping,QM)模型是思维建构和智能模拟的属性论方法中的的基本数学模型,它表达的是事物属性量—质特征转化关系,其哲学基础是事物质量互变规律,其基本内涵
随着计算机技术和网络技术不断发展,远程教学作为一种新的教学模式方兴未艾。由于远程虚拟实验室能够解决实验室资金和资源相对紧张的状况,虚拟实验室在远程教学中得到了越来越
数据仓库是近年来兴起的一种新的数据库技术,它面向分析型环境,弥补了传统关系型数据库对分析型环境的支持不足,对企业的分析决策提供了强有力的支持。数据仓库是多个分布的
随着Web服务标准的完善和支持Web服务平台的逐步成熟,网络上的可用的服务越来越多,基于Web服务的应用也越来越多。由于当前Web服务所使用的协议都是基于描述基础,缺乏有效的
在过去数年中,短距离高速无线通信系统呈现出巨大的发展潜力。而其中具有高性能、低功耗和低成本无线数据通信能力的超宽带技术成为未来富有竞争力的技术之一。 本文首先对
多维建模一直是数据仓库中一个非常具有挑战性的问题,也是最基本的问题。多维建模的好坏关系到数据仓库的健壮性,功能性以及查询效率等。目前的研究工作往往将用户的需求和数据