搜索筛选:
搜索耗时0.1090秒,为你在为你在9,420,000篇论文里面共找到 16 篇相符的论文内容
类      型:
[期刊论文] 作者:毛盈方,卢守峰,, 来源:交通科学与工程 年份:2014
现有的信号配时强化学习模型大多是风险中立的强化学习模型,其缺点是在线学习中稳定性和鲁棒性较差,需要的运行时间较长,且收敛效果不明显.为了解决存在的这些问题,建立了风...
[期刊论文] 作者:刘黎,, 来源:计算机仿真 年份:2014
研究电机转角的高精度控制问题。高精度电机的转角对误差精度要求很高,调度控制存在惯性误差,传统的角度控制方法中,由于运算过程中存在控制时差,造成控制过程粗糙,为了避免上述传......
[学位论文] 作者:刘政,, 来源: 年份:2014
由于电梯群组系统在实际的生活中有着重要的意义,电梯群组的调度问题得到广泛关注。乘客对电梯服务质量的要求也越来越高,单台电梯已不能很好很快的满足乘客的需求。缩短乘客的......
[学位论文] 作者:毛盈方,, 来源:长沙理工大学 年份:2014
目前,城市的交通问题已成为了制约城市经济发展的重要影响因素。如何解决交通拥堵,保障交通系统顺畅、有序地运行已成为政府工作中的重中之重。而局限于城市空间的有限、经济...
[期刊论文] 作者:黄文明,, 来源:基础教育参考 年份:2014
随着我国基础教育向均衡发展阶段的转变,促进教育公平成为教育科学发展的必然要求。对于班级教学来说,实现教育过程公平就是面对学生差异,让学生得到差异发展,在班级授课的框架内......
[期刊论文] 作者:唐昊,张晓艳,韩江洪,周雷,, 来源:计算机学报 年份:2014
针对大规模或复杂的随机动态规划系统,可利用其分层结构特点或引入分层控制方式,借助分层强化学习(Hierarchical Reinforcement Learning,HRL)来解决其“维数灾”和“建模难...
[期刊论文] 作者:刘洋,崔颖,李鸥,, 来源:信号处理 年份:2014
认知无线电系统不仅要具有自适应性,更应具备一定的智能性.该文将强化学习理论引入到认知无线电系统中,用于解决次用户在频谱感知过程中的信道选择问题,提出了一种基于强化学...
[学位论文] 作者:秦春斌,, 来源: 年份:2014
结合强化学习思想的近似动态规划是利用函数近似结构来逼近动态规...
[期刊论文] 作者:韩春华,, 来源:教书育人 年份:2014
这句话生动而全面地诠释了激发学生学习兴趣、强化学习动机在教学中的重要意义。只有产生了浓厚的学...
[期刊论文] 作者:陈悦,潘洪建,, 来源:江苏教育研究 年份:2014
强化学习动机,激发自主学习愿望;确定适宜目标,引导自主学习行为;加强学法指导,优化自主学习策略,有助于全面提升了大班额英语教学...
[期刊论文] 作者:刘伟,, 来源:中外企业家 年份:2014
新形势下,工会干部要强化学习,不断提高综合素质,更好地推动企业和谐发展。...
[期刊论文] 作者:陈兴国,高阳,范顺国,俞亚君,, 来源:模式识别与人工智能 年份:2014
强化学习算法通常要处理连续状态及连续动作空间问题以实现精确控制.就此文中结合Actor-Critic方法在处理连续动作空间的优点及核方法在处理连续状态空间的优势,提出一种基于...
[期刊论文] 作者:卢佳, 王小丹, 白建强,, 来源:兰州教育学院学报 年份:2014
MOOCs顺应时代发展要求,在强化学习体验的同时,促进了深度学习——概念转变的...
[期刊论文] 作者:朱美强,李明,程玉虎,张倩,王雪松,, 来源:控制与决策 年份:2014
在基于目标的强化学习任务中,欧氏距离常作为启发式函数用于策略选择,其用于状态空间在欧氏空间内不连续的任务效果不理想.针对此问题,引入流形学习中计算复杂度较低的拉普拉...
[学位论文] 作者:王云龙,, 来源: 年份:2014
本文针对复杂装备能耗高而装备本身功能复杂、结构复杂、约束关系复杂、变量多且相互耦合,难以用传统设计方法进行低能耗化设计的问题,提出了基于历史数据的复杂装备(?)损预...
[期刊论文] 作者:傅启明,刘全,王辉,肖飞,于俊,李娇,, 来源:计算机学报 年份:2014
将函数逼近用于强化学习是目前机器学习领域的一个新的研究热点.针对传统的基于查询表及函数逼近的Q(A)学习算法在大规模状态空间中收敛速度慢或者无法收敛的问题,提出一种基于线...
相关搜索: