搜索筛选:
搜索耗时0.5993秒,为你在为你在102,267,441篇论文里面共找到 2 篇相符的论文内容
类      型:
[学位论文] 作者:苏浩铭, 来源:合肥工业大学 年份:2008
强化学习是一种无监督的机器学习技术,能够利用不确定的环境奖赏发现最优的行为序列,实现动态环境下的在线学习,因此被广泛用于Agent的智能决策。Q学习算法是目前主流的强化...
[期刊论文] 作者:苏浩铭,王浩,, 来源:合肥工业大学学报(自然科学版) 年份:2008
收敛速度是衡量机器学习算法的一个重要指标,在强化学习中,如果算法不充分利用从每次学习中获取的经验知识,算法的收敛速度则比较缓慢;为了提高强化学习的收敛速度,文章将环...
相关搜索: