搜索与苏浩铭相关的论文

搜索筛选:

搜索耗时0.5993秒,为你在为你在102,267,441篇论文里面共找到 2 篇相符的论文内容

类型:

全部期刊学位会议报纸英文

发布年度:

全部 2024 2023 2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 2012 2011 2010 2009 2008 2007 2006 2005 2004 2003 更早

排序方式:

相关性最新发表最早发表

基于模型知识的大空间强化学习算法的研究与实现

[学位论文] 作者：苏浩铭, 来源：合肥工业大学年份：2008

强化学习是一种无监督的机器学习技术,能够利用不确定的环境奖赏发现最优的行为序列,实现动态环境下的在线学习,因此被广泛用于Agent的智能决策。Q学习算法是目前主流的强化...

下载此文

一种基于模型的强化学习算法

[期刊论文] 作者：苏浩铭,王浩,, 来源：合肥工业大学学报(自然科学版) 年份：2008

收敛速度是衡量机器学习算法的一个重要指标,在强化学习中,如果算法不充分利用从每次学习中获取的经验知识,算法的收敛速度则比较缓慢;为了提高强化学习的收敛速度,文章将环...

下载此文