搜索筛选:
搜索耗时0.2485秒,为你在为你在78,380,000篇论文里面共找到 132 篇相符的论文内容
类      型:
[期刊论文] 作者:陈宗海,杨志华,王海波,盛捷,, 来源:控制与决策 年份:2008
为推进强化学习研究的进一步深入和扩大其实际应用范围,从强化学习研究的理论基础——知识表示和运用的角度对强化学习进行分类,并就经典随机强化学习、模糊强化学习、定性强...
[期刊论文] 作者:刘忠,李海红,刘全,, 来源:计算机工程与设计 年份:2008
针对智能Agent运动中普遍存在的避障问题,结合强化学习具有的试错和环境交互获得在某状态下选择动作的策略以及无导师在线学习等特性。在介绍强化学习的原理、分类以及主要算...
[期刊论文] 作者:喻建鹏, 桂建平,, 来源:电脑知识与技术 年份:2008
强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支,该文首先介绍了强化学习的基本原理结构和各种算法;然后介绍了近...
[期刊论文] 作者:何源,张文生,, 来源:微计算机信息 年份:2008
传统的强化学习算法通常假设状态空间和行动空间是离散的,而实际上很多问题的状态空间是连续的,这就大大地限制了强化学习在实际中的应用。为克服以上不足,本文提出了一种基...
[期刊论文] 作者:赵志宏,黄蕾,刘峰,骆斌,, 来源:广西师范大学学报(自然科学版) 年份:2008
强化学习和规划技术在目标上有着很高的相似性,而在技术上又具有互补性,因此,基于强化学习的Agent规划规则抽取问题长期以来一直是研究的热点。针对基于强化学习的多Agent系统在...
[期刊论文] 作者:毛俊杰,刘国栋,, 来源:计算机工程与应用 年份:2008
针对传统的多Agent强化学习算法中,Agent学习效率低的问题,在传统强化学习算法中加入具有经验知识的函数;从心理学角度引入内部激励的概念,并将其作为强化学习的激励信号,与...
[期刊论文] 作者:梁宏倩,, 来源:西安文理学院学报(自然科学版) 年份:2008
多Agent系统中的强化学习是近年发展起来的一种新的人工智能方法,是以单Agent强化学习Q-learning算法为基础的一种学习模型,由于现有的强化学习模型还存在着结构信度分配困难...
[期刊论文] 作者:焦殿科,石川,, 来源:计算机工程 年份:2008
合作多主体强化学习的关键问题在于如何提高强化学习的学习效率。在追捕问题的基础上,该文提出一种共享经验的多主体强化学习方法。通过建立合适的状态空间使猎人共享学习经验...
[期刊论文] 作者:王巍巍,陈兴国,高阳,, 来源:模式识别与人工智能 年份:2008
平均奖赏强化学习强化学习中的一类重要的非折扣最优性框架,目前大多工作都主要是在离散域进行.本文尝试将平均奖赏强化学习算法和函数估计结合来解决连续状态空间的问题,...
[期刊论文] 作者:苏浩铭,王浩,, 来源:合肥工业大学学报(自然科学版) 年份:2008
收敛速度是衡量机器学习算法的一个重要指标,在强化学习中,如果算法不充分利用从每次学习中获取的经验知识,算法的收敛速度则比较缓慢;为了提高强化学习的收敛速度,文章将环...
[期刊论文] 作者:陶隽源, 孙金玮, 李德胜,, 来源:吉林大学学报(工学版) 年份:2008
提出了一种基于最小线性平均的强化学习算法,用于解决连续空间下强化学习函数估计的非收敛性问题。该算法基于梯度下降法,根据压缩映射原理,通过采用线性平均法作为值函数估...
[期刊论文] 作者:林芬,石川,罗杰文,史忠植,, 来源:计算机研究与发展 年份:2008
传统的强化学习存在收敛速度慢等问题,结合先验知识预置某些偏向可以加快学习速度.但是当先验知识不正确时又可能导致学习过程不收敛.对此,提出基于偏向信息学习的双层强化学习模...
[期刊论文] 作者:邢宇明,白振兴,, 来源:微计算机信息 年份:2008
提出将MaxQ分层增强式学习应用于足球机器人进攻策略学习,提高了强化学习的性能。通过在Robocup中的应用和实验,得出基于MaxQ分层强化学习的效果要优于传统的强化学习方法。...
[期刊论文] 作者:孙惠萍,龚声蓉,王朝晖,刘全, 来源:计算机工程与应用 年份:2008
提出了基于强化学习的相关反馈算法。根据强化学习中的Q_学习函数,建立矩阵Q,对每幅图像建立对...
[期刊论文] 作者:郑宇,罗四维,吕子昂,, 来源:计算机工程与应用 年份:2008
倒立摆系统是强化学习的一种重要的应用领域。首先分析指出在倒立摆系统中,常用的强化学习算法存在着极限环问题,算法无法正确收敛、控制策略不稳定。但是由于在简单的一级倒立...
[期刊论文] 作者:, 来源:新长征 年份:2008
周成仕、罗明、马炜在2008年第7期《红旗文稿》杂志上撰文指出:为了培养高素质干部.可从四个方面着手强化学习。一、认清学习压力。强化自觉性。来自社会发展的压力。适应工作...
[期刊论文] 作者:陆军,付成伟,, 来源:自动化技术与应用 年份:2008
分层强化学习中自动分层问题目前仍未得到有效的解决,本文针对Option方法,研究了基于核密度估计的Option自动生成算法,该算法根据分层强化学习的特点并结合改进后的核密度估计层...
[期刊论文] 作者:卞建勇,徐建闽,裴海龙,, 来源:华南理工大学学报(自然科学版) 年份:2008
文中首先提出了一种结合虚拟检测线的统计背景提取方法,然后运用背景差法提取运动车辆信息,再在运动车辆区域运用SUSAN(Smallest Univalue Segment AssimilatingNucleus)算法提取车辆角点特征,在此基础上运用强化学习进行车辆跟踪...,充分发挥了强化学习搜索效率高的特性.实验结果表明:文中方...
[期刊论文] 作者:段勇,杨淮清,崔宝侠,徐心和,, 来源:机器人 年份:2008
主要研究了强化学习算法及其在机器人足球比赛技术动作学习问题中的应用.强化学习的状态空间和动作空间过大或变量连续,往往导致学习的速度过慢甚至难于收敛.针对这一问题,提出了...
[期刊论文] 作者:彭志平,李绍平,, 来源:计算机应用研究 年份:2008
首先介绍了半马尔可夫决策过程、分层与抽象等分层强化学习的理论基础;其次,较全面地比较HAM、options、MAXQ和HEXQ四种典型的学习方法,从典型学习方法的拓展、学习分层、部分感...
相关搜索: