再励学习相关论文
针对飞行器姿态系统讨论了飞行器的俯仰姿态跟踪问题.将再励学习神经网络引入飞行器姿态系统,通过内部再励信号在线修改控制器参数......
该文借鉴模糊控制的推理能力和神经网络的学习行为着重研究了智能控制的一个重要分支;基于模糊控制和神经网络协作和融合的软计算......
该文以智能体技术在企业内部网中的应用为研究背景,完成了以下工作:1.根据智能体和多智能体系统的特点,提出了一种基于多智能体的......
该文介绍了作者在该课题里面所做的工作:包括在SoccerServer的有限通讯和环境因素复杂的情况下,怎样增强智能体对环境信息的感知能......
再励学习方法一般只能接受离散化的状态输入,给出离散值的控制输出.但是,学习智能体所处的环境通常是空间连续的,对连续的状态空间......
分类器系统是J.H.Holland等人提出的一类人工智能系统,主要目的是为了解决人工智能系统的适应性问题,试图赋予人工智能系统一种高......
本文主要研究模糊控制在单路口信号灯控制中的应用.根据交警在指挥交通时的思想,提出一种多相位模糊控制方案.即在对某相位放行时,......
近年来Agent以及MAS的研究成为分布式人工智能研究的一个热点。单Agent因个体所拥有的知识、能力的限制,因此对MAS的研究迅速发展。......
本文提出了基于改进的Q-Learning算法——Fuzzy Q-Learning,实现了运用Fuzzy Q-Learning算法构造Robocup中断球模型的学习过程.我......
本论文提出了一种基于ANFIS的再励学习模型,这种模型克服了普通再励学习中学习速度慢的缺点和难以处理连续状态问题,并将此模型成......
研究了一种带有CMAC神经网络的再励学习 (RL)控制方法 ,以解决具有高度非线性的系统控制问题 .研究的重点在于算法的简化以及具有......
本文对具有不确定控制对象提出了一种基于再励学习的神经网络模糊控制器.文中给出了这种自学习控制器的结构,并对算法进行了详细的......
设计活动是产品开发过程中最重要环节之一,在CAD(Computer-Aided Designl),CAE(Computer-Aided Engineering)和CAM(Computer-Aided M......
针对以往CMAC(CerebellarModel Articulation Controller)神经网络控制中的收敛性、学习能力、鲁棒性以及稳定性等性能问是,该文力......
该课题是基于RoboCup组织仿真平台SoccerServer进行各种算法的研究.组建了一支仿真的足球队.该文研究了SoccerServer的有限通讯和......
随着多移动机器人系统的应用越来越向未知领域如医学领域、深海探测和航空航天领域等方向发展,在未知环境下解决避障路径规划问题......
提出了一种综合智能化的控制系统设计思想,并将其应用在发电机的励磁控制上,所设计的综合智能型电力系统稳定器兼顾对发电机端电压......
提出一种将再励学习与遗传算法相结合的遗传再励学习方法对交通信号进行自组织控制。再励学习是针对每一个道路交叉口交通流的优化......
提出了一种固定长度经验回放的思想,并将该思想与一步Q和Peng Q(λ)学习算法相结合,得到了相应的改进算法。该文采用不同的回放长......
在诸如机器人足球赛等典型的可分解马尔可夫决策过程(factored Markov decision process,简称FMDP)模型中,不同状态属性在不同的状......
结合控制系统设计问题的特点,将遗传算法和再励学习分别引入到模糊神经网络控制器的离线训练和在线应用过程中,提出了一种综合智能......
针对解决对传统的多A gen t再励学习算法中,A gen t只能独立学习、不能合作学习的问题和启发式算法中只考虑了单个A gen t而没有推......
本文给出了一种改进的基于再励算法的神经网络BOXES控制系统,引入超维椭球体模糊划分状态空间的概念,并且通过神经网络的再励学习......
为试验和比较各种先进的群体Agent合作求解智能算法,给群体Agent合作策略提供一个比较与测试的平台,该文针对传统的测试平台过分强......
为了研究仿人、能量高效的双足机器人步行,研制了由MACCEPA(mechanically adjustable compliance and controllable equilibrium p......
本文对具有时滞的不确定控制对象提出了一种带有神经网络的Smith预估器再励学习控制方法 .文中还给出了再励学习系统中模糊自适应......
综述了再励学习的原理,主要算法,基于神经网络的实现及其在智能控制中的作用,探讨了应进一步研究的问题。......
再励学习是一种利用评价信息(而不是网络实际输出与期望输出之差)来改善行为的神经模糊算法,采用"奖""罚"信号训练控制器.用再励学......
为了满足卫星姿态控制系统对控制精度、抗干扰和鲁棒性要求的不断提高,将模糊神经网络结合再励学习算法应用到卫星姿态控制系统中,......
提出一种模糊神经网络的自适应控制方案。针对连续空间的复杂学习任务,提出了一种竞争式Takagi—Sugeno模糊再励学习网络,该网络结构......
在已知障碍物的环境中寻找一条从起点到终点的无碰路径即为路径规划。扩展改进型蚁群算法应用背景,应用于智能水下机器人(AUV)的路径......
再励学习(Reinforcement Learning,RL)是一种成功地结合动态编程和控制问题的机器智能方法,它将动态编程和有监督学习方法结合到机器学......
本文研究了多约束QoS路由问题,给出基于模糊评判的路由模型,实现了多QoS约束的综合优化;同时提出一种再励学习蚁群路由算法对该问题进......
从最优决策的角度出发,将人工智能中的再励学习方法引入主动队列管理的研究中,提出了一种基于再励学习的主动队列管理算法RLGD(rei......
在诸如机器人足球赛等典型的可分解马尔可夫决策过程(factored Markov decision process,简称FMDP)模型中,不同状态属性在不同的状态......
随着多移动机器人协调系统的应用向未知环境发展,一些依赖于环境模型的路径规划方法不再适用,而利用再励学习与环境直接交互,不需要先......
股票市场是市场经济的重要组成部分。但是现有的基于演绎推理的理论分析方法在处理股市这类复杂性系统时遇到了很多困难,因此基于归......
给出了机器人足球系统基于行为的智能主体系统的模型结构.将足球机器人的行为分为3个层次,并描述了行为在各层之间的变迁,引入了再......
针对矢量控制交流调速系统,该文提出并设计了一种基于再励学习的模糊神经网络速度控制器。详细介绍了基于遗传算法的神经网络权重在......
利用基于部分可观马尔可夫决策过程的策略搜索模型,提出了一种具有优化行为的策略搜索算法,并推导出满足匹配律的策略算法.被试可......
演化艺术通过演化计算演绎出众多妙趣横生的图片,使人们的生活更加多姿多彩。传统演化艺术系统,多采取基于树的表示法,由人工筛选......
提出一种将再励学习与遗传算法相结合的遗传再励学习方法对交通信号进行自组织控制,再励学习是针对第五个道路交叉口交通流的优化,修......
基于大系统递阶控制思想,提出了一种运用再励学习算法设计歼击机自动着陆横侧向协调控制系统的方法.将再励学习算法引入歼击机着陆......