搜索筛选:
搜索耗时0.6808秒,为你在为你在102,285,761篇论文里面共找到 226 篇相符的论文内容
类      型:
[期刊论文] 作者:仵博,郑红燕,冯延蓬,陈鑫,, 来源:电子学报 年份:2014
针对贝叶斯强化学习中参数个数巨大,收敛速度慢,无法实现在线学习的问题,提出一种基于模型的可分解贝叶斯强化学习方法.首先,将学习参数进行可分解表示,降低学习参数的个数;...
[期刊论文] 作者:董博,刘克平,李元春,, 来源:吉林大学学报(工学版) 年份:2014
基于ction-critic-identifier(ACI)与RBF神经网络,提出了一种外界动态约束下的可重构模块机器人分散强化学习最优控制方法,解决了存在强耦合不确定性的模块机器人系统的连续时...
[期刊论文] 作者:叶锦华,李迪,叶峰,, 来源:吉林大学学报(工学版) 年份:2014
针对包含执行器动力学模型的三阶不确定非完整轮式移动机器人系统,提出了一种基于反演设计和双强化学习自适应模糊系统的轨迹跟踪控制方法。该控制方法对运动学控制器采用分流...
[期刊论文] 作者:杨宛璐,陈玮,黄浩晖,王广涛,, 来源:计算机工程与设计 年份:2014
强化学习是人工智能领域中解决学习控制的一种重要方法。在强化学习算法中,平均奖赏强化学习是以平均奖赏值作为参照标准,适用于解决具有循环特性或不具终结状态的问题,其存在参...
[期刊论文] 作者:赵烨,, 来源:煤炭技术 年份:2014
将分层强化学习算法中的子任务应用于同类学习任务中是当前强化学习的一个研究热点。在控制系统中,分层强化学习算法存在着子任务受系统参数影响而难以重用的问题。针对这一...
[学位论文] 作者:于俊, 来源:苏州大学 年份:2014
强化学习是一类重要的机器学习方法,强化学习具有两个重要的特征:算法可以在不知道环境的全部模型时,求解模型未知的最优化问题;强化学习强调Agent与环境的在线交互,在交互过程中...
[期刊论文] 作者:王瑜,, 来源:新课程(中) 年份:2014
在新世纪教育教学的洪流中,教学转向的核心是教学本质观的转向,必须用全新的教学观审视习以为常的小学数学教学。将学生作为学习的主人和知识的探索者,而不是被动的接受者,使...
[期刊论文] 作者:霍艳微, 来源:祖国·教育版 年份:2014
【摘 要】运用现代化教学手段,把板书的内容,课后作业,课文中所描写的人物或景物放映出来,就能大大节省时间,提高课堂效率,更能激发学生的学习兴趣,从而调动其学习的主动性,最终达到提高语文课堂教学效率的目标。  【关键词】语文;兴趣;学习动机  《普通高中语文课程......
[期刊论文] 作者:朱斐,刘全,傅启明,伏玉琛,, 来源:计算机研究与发展 年份:2014
解决具有连续动作空间的问题是当前强化学习领域的一个研究热点和难点.在处理这类问题时,传统的强化学习算法通常利用先验信息对连续动作空间进行离散化处理,然后再求解最优...
[学位论文] 作者:周鑫, 来源:苏州大学 年份:2014
强化学习是一种通过与环境的交互,将状态映射到动作,以获取最大累积奖赏的机器学习方法。在大规模和连续状态或动作空间强化学习问题中,通过使用函数逼近方法拟合策略形成了近似...
[期刊论文] 作者:邱金波,周晓柯,, 来源:广东石油化工学院学报 年份:2014
分层强化学习是为了解决强化学习“维数灾”的问题而提出的。Options的分层结构使Agent能更高效地完成学习任务,但通常Options的学习是在同一个状态空间的,Agent学习到的知识不...
[学位论文] 作者:穆翔, 来源:苏州大学 年份:2014
强化学习是一种用于求解可以建模为马尔科夫决策过程问题的机器学习方法,其通过Agent与环境交互以获得最大累计奖赏的方式进行学习。当前强化学习面临的主要挑战和机遇是如何...
[期刊论文] 作者:宋拴,俞扬,, 来源:计算机工程与应用 年份:2014
强化学习研究智能体如何从与环境的交互中学习最优的策略,以最大化长期奖赏。由于环境反馈的滞后性,强化学习问题面临巨大的决策空间,进行有效的搜索是获得成功学习的关键。以往...
[期刊论文] 作者:朱毅,, 来源:数学学习与研究 年份:2014
作业批改是教学中的一个重要环节,这个环节的重要性视乎随着学生年龄的增大,越来越不受到教师的重视.在小学阶段,教师会在学生作业中有错误的地方精心地批注,指导学生纠正.而...
[期刊论文] 作者:吴敏, 来源:学校教育研究 年份:2014
随着终身教育理论的提出,成人教育教学越来越受到重视。在国外相继提出了著名的“自我导向型学习理论”和转化学习理论等,对世界的成人教育事业的发展起了巨大的推动作用。然而,在国内,关于成人教育教学的研究一方面是简单地借鉴国外的理论,另一方面是还没有走出传统......
[期刊论文] 作者:齐宣, 来源:黑龙江国土资源 年份:2014
本报讯齐齐哈尔市土地统征工作站深入开展党的群众路线教育实践活动,采取多种学习形式,全面提升工作人员的业务水平,取得了良好的效果。日前,该单位组织工作人员专程到甘南县国土......
[期刊论文] 作者:柏维, 来源:中国科技博览 年份:2014
摘要:建设学习型党组织,坚持“学以立德、学以增智、学以创业”的科学标准,把各级党组织建设成为学习型党组织,是建设马克思主义学习型政党的基础工程。  关键词: 建设 学习型 党组织  建设学习型党组织,是建设马克思主义学习型政党的基础工程。广大党员干部尤其......
[期刊论文] 作者:刘黎,, 来源:计算机仿真 年份:2014
研究电机转角的高精度控制问题。高精度电机的转角对误差精度要求很高,调度控制存在惯性误差,传统的角度控制方法中,由于运算过程中存在控制时差,造成控制过程粗糙,为了避免上述传......
[期刊论文] 作者:李炎武,陈渝,曾庆维,罗程,林涛, 来源:四川大学学报:自然科学版 年份:2014
当前游戏中非玩家角色(Non-player Character,NPC)的行为主要基于随机决策或者传统的预定义行为决策,该方法的NPC不具有对游戏环境的自主学习能力.本文研究的目的是探索将强化...
[学位论文] 作者:李鹏程, 来源: 年份:2014
地球资源日益枯竭,然而由于社会发展和人口剧增等因素,这些资源却遭到过度的开发和利用。随之而来的温室效应和大气污染等问题使得人类不得不寻求绿色可持续的能源,风能作为一种清洁高效无污染的能源越来越受到广泛的重视。风力发电已经形成了一种产业,各国在风电理......
相关搜索: