搜索筛选:
搜索耗时0.4118秒,为你在为你在102,267,441篇论文里面共找到 1 篇相符的论文内容
类      型:
[学位论文] 作者:赵晨萧,, 来源:华东师范大学 年份:2020
强化学习以马尔可夫决策过程为基础,普遍适用于各类序列决策与规划问题的建模,因此在机器学习研究中受到了越来越多的关注,并部署应用在一些现实世界场景中。然而,大量研究证据表明,通过强化学习训练得到的模型在面对不同的环境动态时缺乏足够的泛化能力:当训练......
相关搜索: