基于Q—learning的一种多Agent系统结构模型

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:CT1978
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多Agent系统是近年来比较热门的一个研究领域,而Q-learning算法是强化学习算法中比较著名的算法,也是应用最广泛的一种强化学习算法。以单Agent强化学习Qlearning算法为基础,提出了一种新的学习协作算法,并根据此算法提出了一种新的多Agent系统体系结构模型,该结构的最大特点是提出了知识共享机制、团队结构思想和引入了服务商概念,最后通过仿真实验说明了该结构体系的优越性。
其他文献
B超在子宫发育异常的诊断价值河北医学院四院河北医学院四院超声科刘明瑜,孙心平,杨漪河北医学院四院妇产科王素兰河北医学院四院泌尿科高兴茂河北医学二院功能科魏溶,李涛邮政编
【摘要】当学生步入到高中学习阶段后,教师从主导位置转变成引导位置,所以教师要培养学生自主创新的学习能力,培育学生的教学主题意识,让学生掌握适合自己学习情况的学习方法,并积极调动学生在学习过程中的主观能动性。  【关键词】高中物理 自主学习 引导教学  一、前言  随着时代的发展,我国传统的教学方式已经无法满足社会发展对人才的需求和要求,所以我国教育行业正进行深入、科学的改革,其中,要求教师要对学生
【摘要】数学教学培养学生自主学习能力是时代的要求,也是落实“育人为本”教育方针的重要体现。作为基础教育的数学不是以培养尖端的数学精英为目的的,而是培养具有一定数学素养的建设者。因此,数学教学要让学生通过数学学习,在获得基本数学知识技能的同时,发展数学综合能力。  【关键词】中学数学 自主学习 教学探索  《数学课程标准》明确地提出:“有效的数学教学不能单纯地依赖模仿与记忆,动手实践、自主探索与合作
文中分析了“九五”期间江西粮棉比价,棉花生产效益,探讨2002年江本棉花生产的走势;提出了加大科技投入,主攻单产增效;实行简化节本栽培;调优种植结构,稳定高产棉田;扶持植棉专业大户
数字岩心成像技术在石油地质领域已经得到了广泛的运用。运用模拟重建的方法,能够得到高精度的三维数字岩心图像,较好地重现了岩石内部的微观孔隙结构。然而,高精度图像在带来丰富信息量的同时,也带来了巨大的数据量和计算复杂度的问题。随着重建图像的增大,重建算法的时间复杂度呈指数上涨。因此选择合适的分辨率,成为了一个关键的问题。论文通过分析各种分辨率条件下孔隙结构参数的变化趋势,总结了分辨率对孔隙参数的影响,
【摘要】社会经济的发展与转型对人才的专业化和职业化提出了更加明确的要求,人才对口培养与供应对经济的结构性调整也起着量变引起质变的潜在性调整作用。中等职业学校作为培养专业技术性人才的职业机构,紧跟国家经济社会发展形势,积极调整专业培育与教学方法,真正实现以社会需求为导向、以学生专业技术为宗旨、以提升职业教育水平为立足点的多赢局面,做到教育资源、教师及学生人才资源的合理化配置,是新形势对中职学校职业教
苏霍姆林斯基说:“儿童的智慧在于手指上。”这就告诉我们学生各种能力的培养、提高是从动作开始的。著名的教育家陶行知先生说:“单纯的劳动不能算做,只能算蛮干;单纯的想,只是空想;只有将操作与思维结合起来,才能达到思维之目的。”教师是在做上教,学生是在做上学。教而不做,不能算是教,学而不做,不能算是学,教与学都以“做”为中心,因此,在英语教学中要做到“教学做合一”。我想说:教师拿做来教,方是真教;学生拿
棉花“无土栽培”即无土育苗,无钵体移栽,应用生根剂、保叶剂,无土基质等新技术材料进行工厂化育苗,把过去栽不活的棉花变为栽棉如栽菜一样简单。具有商业化、产业化、市场化,前景
进入21世纪,我国为实现第三步战略目标,达到民族复兴,已制定科教兴国战略,按照邓小平科学技术是第一生产力的指导思想,致力于国家创新体系的建设."十五”期间,国家的整体战略
基于分类模型的目标跟踪算法采用分类模型实现对多目标的跟踪。在传统算法中目标跟踪的对象是每个传感器的实时采样,而在分类模型中将传感器采样根据分类规则进行分类。然后