再励学习相关硕士博士期刊学术论文

再励学习相关论文

飞行器姿态的再励学习跟踪控制

针对飞行器姿态系统讨论了飞行器的俯仰姿态跟踪问题.将再励学习神经网络引入飞行器姿态系统,通过内部再励信号在线修改控制器参数......

会议

飞行器姿态控制再励学习神经网络跟踪控制

模糊神经网络控制系统研究及在汽车主动安全性控制中应用

该文借鉴模糊控制的推理能力和神经网络的学习行为着重研究了智能控制的一个重要分支;基于模糊控制和神经网络协作和融合的软计算......

学位

模糊控制神经网络软计算自适应控制再励学习监督学习滑模控制稳定性人-车-路环境汽车主动安全性智能驾驶模糊聚类学习控制

智能体技术及其在企业内部网中的应用研究

该文以智能体技术在企业内部网中的应用为研究背景,完成了以下工作:1.根据智能体和多智能体系统的特点,提出了一种基于多智能体的......

学位

智能体多智能体系统企业内部网再励学习管理信息系统

足球机器人智能决策控制系统

该文介绍了作者在该课题里面所做的工作:包括在SoccerServer的有限通讯和环境因素复杂的情况下,怎样增强智能体对环境信息的感知能......

学位

智能体分布式多智能体 RoboCup 动态决策组件模型再励学习

一种基于模糊神经网络采用再励学习的PID控制器

PID控制是最早发展起来的控制策略之一，在控制理论和技术飞速发展的今天，PID控制由于其简单、稳定性能好、可靠性能高等优点，仍广泛的......

学位

PID控制器模糊神经网络智能控制被控对象控制原理模糊控制技术控制理论控制系统设计参数组在线调整

面向连续空间的模糊再励学习方法的研究

再励学习方法一般只能接受离散化的状态输入,给出离散值的控制输出.但是,学习智能体所处的环境通常是空间连续的,对连续的状态空间......

学位

再励学习模糊推理系统神经-模糊控制遗传算法语言评价

基于再励学习的分类器系统研究

分类器系统是J.H.Holland等人提出的一类人工智能系统,主要目的是为了解决人工智能系统的适应性问题,试图赋予人工智能系统一种高......

学位

分类器系统再励学习 LCS系统

模糊控制在信号灯控制中的应用

本文主要研究模糊控制在单路口信号灯控制中的应用.根据交警在指挥交通时的思想,提出一种多相位模糊控制方案.即在对某相位放行时,......

学位

模糊控制信号灯控制模糊规则集多相位再励学习交通流

基于进化的再励学习方法的多机器人地图构建研究

近年来Agent以及MAS的研究成为分布式人工智能研究的一个热点。单Agent因个体所拥有的知识、能力的限制，因此对MAS的研究迅速发展。......

学位

Agent MAS 地图构建协同进化再励学习

基于智能控制的主动队列管理算法研究

在过去的二十年中,计算机网络经历了爆炸式的增长,随之而来的是越来越严重的拥塞问题。拥塞控制是确保Internet鲁棒性的关键因素,......

学位

拥塞控制模糊控制再励学习主动队列 NS

再励学习在Robocup中的应用

本文提出了基于改进的Q-Learning算法——Fuzzy Q-Learning,实现了运用Fuzzy Q-Learning算法构造Robocup中断球模型的学习过程.我......

会议

再励学习算法构造学习过程断球行为球模型复杂度运用球员仿真

一种基于ANFIS的再励学习模型

本论文提出了一种基于ANFIS的再励学习模型,这种模型克服了普通再励学习中学习速度慢的缺点和难以处理连续状态问题,并将此模型成......

会议

再励学习学习速度学习模型整体性能学习算法连续状态仿真结果倒立摆应用论文控制处理

非线性系统的再励学习控制研究(英文)

研究了一种带有CMAC神经网络的再励学习 (RL)控制方法 ,以解决具有高度非线性的系统控制问题 .研究的重点在于算法的简化以及具有......

期刊

再励学习 CMAC神经网络 CMAC 神经网络固定增益学习控制非线性系统学习系统控制精度不确定性

基于再励学习的排队系统优化控制

...

会议

再励学习排队

基于再励自组织模糊CPN的稳定控制系统设计

针对一类非线性系统，提出一种基于再励学习的自组织模糊ＣＰＮ的稳定控制系统。控制结构中采用滑模控制使状态到达设计的切换面，保证系统稳......

期刊

控制系统设计模糊滑模控制 CPN 非线性系统稳定控制系统切换面再励学习补偿控制器控制结构算法设计

再励学习控制器结构与算法

本文对具有不确定控制对象提出了一种基于再励学习的神经网络模糊控制器.文中给出了这种自学习控制器的结构,并对算法进行了详细的......

期刊

控制器结构模糊控制神经网络不确定对象再励学习学习过程仿真结果自学习控制方法控制对象

支持创新概念设计的多Agent系统

设计活动是产品开发过程中最重要环节之一，在CAD(Computer-Aided Designl)，CAE(Computer-Aided Engineering)和CAM(Computer-Aided M......

学位

计算机辅助概念设计多Ageni系统功能-行为-状态模型合同网模型再励学习遗传算法

广义模糊CMAC神经网络控制理论及其在机电系统中的应用研究

针对以往CMAC(CerebellarModel Articulation Controller)神经网络控制中的收敛性、学习能力、鲁棒性以及稳定性等性能问是,该文力......

学位

CMAC神经网络模糊逻辑控制策略鲁棒性再励学习变结构控制电液伺服系统

基于RoboCup仿真比赛智能决策系统设计

该课题是基于RoboCup组织仿真平台SoccerServer进行各种算法的研究.组建了一支仿真的足球队.该文研究了SoccerServer的有限通讯和......

学位

多智能体 RoboCup 再励学习卡尔曼滤波算法足球机器人

复杂连续系统的再励学习算法设计及应用

针对复杂连续系统设计有效的在线再励学习系统跨越从再励学习理论到实际应用的鸿沟,这是该论文所要研究的中心问题.围绕这一中心,......

学位

再励学习复杂连续系统 Q学习算法函数逼近器先验知识

面向多移动机器人系统的再励学习方法研究

随着多移动机器人系统的应用越来越向未知领域如医学领域、深海探测和航空航天领域等方向发展,在未知环境下解决避障路径规划问题......

学位

多移动机器人系统避撞路径规划再励学习平均报酬模型函数逼近器再励函数结构分层再励学习 MDP模型环境部分可观测模型

综合智能型电力系统稳定器的研究

提出了一种综合智能化的控制系统设计思想,并将其应用在发电机的励磁控制上,所设计的综合智能型电力系统稳定器兼顾对发电机端电压......

期刊

模糊神经元网络遗传算法再励学习电力系统稳定器

非线性系统的再励学习控制研究

...

期刊

非线性系统再励学习

基于再励学习和遗传算法的交通信号自组织控制

提出一种将再励学习与遗传算法相结合的遗传再励学习方法对交通信号进行自组织控制。再励学习是针对每一个道路交叉口交通流的优化......

期刊

交通系统信号灯控制再励学习遗传算法

固定长度经验回放对Q学习效率的影响

提出了一种固定长度经验回放的思想,并将该思想与一步Q和Peng Q(λ)学习算法相结合,得到了相应的改进算法。该文采用不同的回放长......

期刊

经验回放再励学习 Q学习

一种基于特特征向量提取的FMDP模型求解方法

在诸如机器人足球赛等典型的可分解马尔可夫决策过程(factored Markov decision process,简称FMDP)模型中,不同状态属性在不同的状......

期刊

群体Agent合作求解可分解马尔可夫决策过程线性规划再励学习维数灾

汽轮发电机组汽门开度控制器的综合智能化设计方法

结合控制系统设计问题的特点,将遗传算法和再励学习分别引入到模糊神经网络控制器的离线训练和在线应用过程中,提出了一种综合智能......

期刊

模糊神经网络遗传算法再励学习汽门开度控制

对称和非对称的启发式多Agent再励学习方法

针对解决对传统的多A gen t再励学习算法中,A gen t只能独立学习、不能合作学习的问题和启发式算法中只考虑了单个A gen t而没有推......

期刊

多Agent系统再励学习启发式算法

一种改进的基于再励学习算法的模糊神经BOXES控制系统

本文给出了一种改进的基于再励算法的神经网络BOXES控制系统,引入超维椭球体模糊划分状态空间的概念,并且通过神经网络的再励学习......

期刊

模糊BOXES控制系统模糊神经网络再励学习

面向语言评价的Takagi-Sugeno模糊再励学习

综合考虑再励学习的两个重要子问题 :连续空间及语言评价问题 ,提出了一种新的学习方法 ,即面向语言评价的 Takagi-Sugeno(T-S)模......

期刊

再励学习语言评价 T-S模糊推理系统神经-模糊控制函数逼近 Q-学习模糊数

基于群体Agent合作求解的测试床--MAS-Soccer

为试验和比较各种先进的群体Agent合作求解智能算法,给群体Agent合作策略提供一个比较与测试的平台,该文针对传统的测试平台过分强......

期刊

多Agent 机器人足球赛再励学习合作求解

基于再励学习的被动动态步行机器人

为了研究仿人、能量高效的双足机器人步行,研制了由MACCEPA(mechanically adjustable compliance and controllable equilibrium p......

期刊

机器人双足机器人被动动态步行再励学习

具有时滞的不确定系统再励学习控制

本文对具有时滞的不确定控制对象提出了一种带有神经网络的Smith预估器再励学习控制方法 .文中还给出了再励学习系统中模糊自适应......

期刊

不确定对象再励学习模糊控制神经网络

再励学习——原理,算法及其在智能控制中的应用

综述了再励学习的原理，主要算法，基于神经网络的实现及其在智能控制中的作用，探讨了应进一步研究的问题。......

期刊

再励学习学习控制智能控制 reinforcement learning learning control intelligent control

再励学习在交通信号控制中的应用

再励学习是一种利用评价信息(而不是网络实际输出与期望输出之差)来改善行为的神经模糊算法,采用"奖""罚"信号训练控制器.用再励学......

期刊

模糊集神经网络交通信号控制再励学习车辆延误仿真 Fuzzy sets Neural networks Traffic signal control

再励学习在卫星姿态控制中的仿真研究

为了满足卫星姿态控制系统对控制精度、抗干扰和鲁棒性要求的不断提高,将模糊神经网络结合再励学习算法应用到卫星姿态控制系统中,......

期刊

再励学习卫星姿态控制模糊神经网络 Reinforcement learning Satellite attitude control Fuzzy ne

基于Takagi—Sugeno的再励学习模糊神经网络控制

提出一种模糊神经网络的自适应控制方案。针对连续空间的复杂学习任务，提出了一种竞争式Takagi—Sugeno模糊再励学习网络，该网络结构......

期刊

倒立摆 Takagi—Sugeno 模糊推理系统再励学习模糊神经网络 Inverted pendulum Takagi-Sugeno Fuzzy infer

基于改进型蚁群算法的AUV路径规划

在已知障碍物的环境中寻找一条从起点到终点的无碰路径即为路径规划。扩展改进型蚁群算法应用背景，应用于智能水下机器人（AUV）的路径......

期刊

路径规划蚁群算法再励学习 DIJKSTRA算法信息素更新自治水下机器人 path planning ant colony algorithm re

再励学习及其在移动机器人行为规划中的应用

再励学习（Reinforcement Learning，RL）是一种成功地结合动态编程和控制问题的机器智能方法，它将动态编程和有监督学习方法结合到机器学......

期刊

再励学习神经网络智能机器人行为规划应用 reinforcement learning neural networks intelligent robot

基于再励学习蚁群算法的多约束QoS路由方法

本文研究了多约束QoS路由问题，给出基于模糊评判的路由模型，实现了多QoS约束的综合优化；同时提出一种再励学习蚁群路由算法对该问题进......

期刊

多约束QOS 模糊评判网络路由再励学习蚁群算法 Multiple constrained QoS Fuzzy judgement Network ro

基于再励学习的主动队列管理算法

从最优决策的角度出发,将人工智能中的再励学习方法引入主动队列管理的研究中,提出了一种基于再励学习的主动队列管理算法RLGD(rei......

期刊

拥塞控制主动队列管理再励学习 congestion control active queue management reinforcement lear

一种基于特征向量提取的FMDP模型求解方法

在诸如机器人足球赛等典型的可分解马尔可夫决策过程(factored Markov decision process，简称FMDP)模型中，不同状态属性在不同的状态......

期刊

群体Agent合作求解可分解马尔可夫决策过程线性规划再励学习维数灾 multi-Agent cooperative problem solving f

基于再励学习的多移动机器人协调避障路径规划方法

随着多移动机器人协调系统的应用向未知环境发展，一些依赖于环境模型的路径规划方法不再适用，而利用再励学习与环境直接交互，不需要先......

期刊

避障路径规划路径规划再励学习再励函数多机器人协调移动机器人 Path planning Reinforcementlearning Reinforce

基于Agent的股票交易模拟及应用

股票市场是市场经济的重要组成部分。但是现有的基于演绎推理的理论分析方法在处理股市这类复杂性系统时遇到了很多困难，因此基于归......

期刊

模拟 AGENT 股市再励学习 simulation agent stock market reinforcement learning

基于行为的机器人足球智能主体系统研究

给出了机器人足球系统基于行为的智能主体系统的模型结构.将足球机器人的行为分为3个层次,并描述了行为在各层之间的变迁,引入了再......

期刊

基于行为的人工智能智能主体再励学习 Artificial intelligence Intelligent agents Robot learning

基于再励学习的交流调速系统模糊神经网络控制

针对矢量控制交流调速系统，该文提出并设计了一种基于再励学习的模糊神经网络速度控制器。详细介绍了基于遗传算法的神经网络权重在......

期刊

模糊神经网络遗传算法再励学习交流调速 fuzzy neural network genetic algorithm reinforcement lea

优化策略模型下的匹配律算法

利用基于部分可观马尔可夫决策过程的策略搜索模型,提出了一种具有优化行为的策略搜索算法,并推导出满足匹配律的策略算法.被试可......

期刊

部分可观马尔可夫决策过程再励学习优化策略搜索匹配律 partially observable Markov decision process reinfo

基于Q-Learning适应度函数的演化艺术

演化艺术通过演化计算演绎出众多妙趣横生的图片,使人们的生活更加多姿多彩。传统演化艺术系统,多采取基于树的表示法,由人工筛选......

期刊

演化艺术笛卡尔遗传规划再励学习 Q学习 Evolutionary Art CGP Machine Learning Q-Learning

基于再励学习和遗传算法的交通信号自组织控制

提出一种将再励学习与遗传算法相结合的遗传再励学习方法对交通信号进行自组织控制，再励学习是针对第五个道路交叉口交通流的优化，修......

期刊

交通信号自组织控制再励学习遗传算法 traffic system signal control reinforcement learning gen

基于再励学习的歼击机安全着陆横侧向协调控制

基于大系统递阶控制思想,提出了一种运用再励学习算法设计歼击机自动着陆横侧向协调控制系统的方法.将再励学习算法引入歼击机着陆......

期刊

递阶控制再励学习侧向控制安全着陆 hierarchical control reinforcement learning lateral-direct

看过本文同时还关注