切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
G-学习相关论文
一种结合Tile Coding的平均奖赏强化学习算法
平均奖赏强化学习是强化学习中的一类重要的非折扣最优性框架,目前大多工作都主要是在离散域进行.本文尝试将平均奖赏强化学习算法......
期刊
强化学习
马尔可夫决策过程(MDP)
R-学习
G-学习
平均奖赏
平均奖赏强化学习算法研究
顺序决策问题常用马尔可夫决策过程(MDP)建模.当决策行为执行从时刻点扩展到连续时间上时,经典的马尔可夫决策过程模型也扩展到半马尔......
期刊
平均奖赏强化学习
性能势
G-学习
马尔可夫决策过程
半马尔可夫决策过程
看过本文同时还关注
如何写好一篇毕业论文
免费论文查重的方法
从零开始写毕业论文的方法
热心助人的动物
第一届全国脊柱脊髓基础研究及临床...
2004世界科技七大看点
对甘肃省国有企业兼并问题的思考
热心助人的动物
对甘肃省国有企业兼并问题的思考
热心助人的动物