搜索与强化学习相关的论文

搜索筛选:

搜索耗时0.1090秒,为你在为你在9,420,000篇论文里面共找到 16 篇相符的论文内容

类型:

全部期刊学位会议报纸英文

发布年度:

全部 2024 2023 2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 2012 2011 2010 2009 2008 2007 2006 2005 2004 2003 更早

排序方式:

相关性最新发表最早发表

基于风险避免强化学习的单交叉口配时优化

[期刊论文] 作者：毛盈方,卢守峰,, 来源：交通科学与工程年份：2014

现有的信号配时强化学习模型大多是风险中立的强化学习模型,其缺点是在线学习中稳定性和鲁棒性较差,需要的运行时间较长,且收敛效果不明显.为了解决存在的这些问题,建立了风...

下载此文

基于强化学习的高精度电机转角控制仿真

[期刊论文] 作者：刘黎,, 来源：计算机仿真年份：2014

研究电机转角的高精度控制问题。高精度电机的转角对误差精度要求很高，调度控制存在惯性误差，传统的角度控制方法中，由于运算过程中存在控制时差，造成控制过程粗糙，为了避免上述传......

下载此文

基于强化学习的电梯群控调度技术研究

[学位论文] 作者：刘政,, 来源：年份：2014

由于电梯群组系统在实际的生活中有着重要的意义，电梯群组的调度问题得到广泛关注。乘客对电梯服务质量的要求也越来越高，单台电梯已不能很好很快的满足乘客的需求。缩短乘客的......

下载此文

风险敏感的强化学习交通信号配时研究

[学位论文] 作者：毛盈方,, 来源：长沙理工大学年份：2014

目前,城市的交通问题已成为了制约城市经济发展的重要影响因素。如何解决交通拥堵,保障交通系统顺畅、有序地运行已成为政府工作中的重中之重。而局限于城市空间的有限、经济...

下载此文

强化学习小组建设为学生提供公平成长机会

[期刊论文] 作者：黄文明,, 来源：基础教育参考年份：2014

随着我国基础教育向均衡发展阶段的转变，促进教育公平成为教育科学发展的必然要求。对于班级教学来说，实现教育过程公平就是面对学生差异，让学生得到差异发展，在班级授课的框架内......

下载此文

基于连续时间半马尔可夫决策过程的Option算法

[期刊论文] 作者：唐昊,张晓艳,韩江洪,周雷,, 来源：计算机学报年份：2014

针对大规模或复杂的随机动态规划系统,可利用其分层结构特点或引入分层控制方式,借助分层强化学习(Hierarchical Reinforcement Learning,HRL)来解决其“维数灾”和“建模难...

下载此文

认知无线电网络中基于强化学习的智能信道选择算法

[期刊论文] 作者：刘洋,崔颖,李鸥,, 来源：信号处理年份：2014

认知无线电系统不仅要具有自适应性,更应具备一定的智能性.该文将强化学习理论引入到认知无线电系统中,用于解决次用户在频谱感知过程中的信道选择问题,提出了一种基于强化学...

下载此文

基于近似动态规划的优化控制研究及在电力系统中的应用

[学位论文] 作者：秦春斌,, 来源：年份：2014

结合强化学习思想的近似动态规划是利用函数近似结构来逼近动态规...

下载此文

如何激发和培养学生的运动兴趣

[期刊论文] 作者：韩春华,, 来源：教书育人年份：2014

这句话生动而全面地诠释了激发学生学习兴趣、强化学习动机在教学中的重要意义。只有产生了浓厚的学...

下载此文

大班额英语自主学习的行动研究

[期刊论文] 作者：陈悦,潘洪建,, 来源：江苏教育研究年份：2014

强化学习动机，激发自主学习愿望；确定适宜目标，引导自主学习行为；加强学法指导，优化自主学习策略，有助于全面提升了大班额英语教学...

下载此文

工会干部需要具备的五种素质

[期刊论文] 作者：刘伟,, 来源：中外企业家年份：2014

新形势下,工会干部要强化学习,不断提高综合素质,更好地推动企业和谐发展。...

下载此文

基于核方法的连续动作Actor-Critic学习

[期刊论文] 作者：陈兴国,高阳,范顺国,俞亚君,, 来源：模式识别与人工智能年份：2014

强化学习算法通常要处理连续状态及连续动作空间问题以实现精确控制.就此文中结合Actor-Critic方法在处理连续动作空间的优点及核方法在处理连续状态空间的优势,提出一种基于...

下载此文

MOOCs促进学习者概念转变的机制研究——基于翻转课堂的MOOCs应用情境

[期刊论文] 作者：卢佳, 王小丹, 白建强,, 来源：兰州教育学院学报年份：2014

MOOCs顺应时代发展要求,在强化学习体验的同时,促进了深度学习——概念转变的...

下载此文

基于拉普拉斯特征映射的启发式Q学习

[期刊论文] 作者：朱美强,李明,程玉虎,张倩,王雪松,, 来源：控制与决策年份：2014

在基于目标的强化学习任务中,欧氏距离常作为启发式函数用于策略选择,其用于状态空间在欧氏空间内不连续的任务效果不理想.针对此问题,引入流形学习中计算复杂度较低的拉普拉...

下载此文

基于强化学习的复杂装备工艺参数低（火用）损设计方法及其应用研究

[学位论文] 作者：王云龙,, 来源：年份：2014

本文针对复杂装备能耗高而装备本身功能复杂、结构复杂、约束关系复杂、变量多且相互耦合,难以用传统设计方法进行低能耗化设计的问题,提出了基于历史数据的复杂装备(?)损预...

下载此文

一种基于线性函数逼近的离策略Q(λ)算法

[期刊论文] 作者：傅启明,刘全,王辉,肖飞,于俊,李娇,, 来源：计算机学报年份：2014

将函数逼近用于强化学习是目前机器学习领域的一个新的研究热点．针对传统的基于查询表及函数逼近的Q（A）学习算法在大规模状态空间中收敛速度慢或者无法收敛的问题，提出一种基于线...

下载此文

看过本文同时还关注