搜索筛选:
搜索耗时0.5582秒,为你在为你在102,267,441篇论文里面共找到 1,000 篇相符的论文内容
类      型:
[学位论文] 作者:刘一鸣, 来源:北京邮电大学 年份:2020
强化学习是智能体通过与环境交互的“试错”,最大化累积奖励,以期找到最优策略的一种学习方式。...随着深度学习在图像识别、自然语言处理、无人驾驶等领域取得成功,其强大的表征能力与强化学习决策能力结合而成的深度强化学习,逐步在博弈游戏、自动驾驶、推荐系统等领域得到应用。...然而,深度强化学习在奖励比较稀疏或者有延迟的情况下,仍然面临着因为策略更新受阻而导致智能体学习性能差的问题。奖励设计是解决上述问题的主要机制...
[期刊论文] 作者:孙悦雯, 柳文章, 孙长银, 来源:自动化学报 年份:2020
基于因果建模的强化学习技术在智能控制领域越来越受欢迎.因果技术可以挖掘控制系统中的结构性因果知识,并提供了一个可解释的框架,允许人为对系统进行干预并对反馈进行分析.量化干预的效果使智能体能够在复杂的情况下...(例如存在混杂因子或非平稳环境)评估策略的性能,提升算法的泛化性.本文旨在探讨基于因果建模的强化学习控制技术(以下简称因果强化学习)的最新进展,阐明其与控制系统各个模块的联系.首先介绍了强化学习的...
[学位论文] 作者:余梦然, 来源:华东师范大学 年份:2020
强化学习以试错的方式,在与环境的交互过程中学习策略。近年来,深度强化学习模型凭借其在游戏中超越人类的性能引起了广泛的关注。虽然深度强化学习模型具有很好的性能,但应用到实际中却存在不容忽视的安全问题。...因此,构建可信的深度强化学习系统是非常必要的。本文主要关注深度强化学习的鲁棒性和安全性两个方面,它们都侧重于模型本身的可信程度。...
[期刊论文] 作者:陈鼎, 黄杨茹, 彭佩玺, 黄铁军, 田永鸿, 来源:计算机学报 年份:2020
借助人工神经网络(Artificial Neural Network,ANN),深度强化学习在游戏、机器人等复杂控制任务中取得了巨大的成功.然而,在认知能力与计算效率等方面,深度强化学习与大脑中的奖励学习机制相比仍存在着巨大的差距...
[期刊论文] 作者:王作为,徐征,王殊, 来源:经济与社会发展研究 年份:2020
首先介绍几种经典深度强化学习方法,接着讨论了深度强化学习算法在导航领域的应用,最后,结合深度强化学习算法的...
[期刊论文] 作者:郑健,陈建,朱琨, 来源:指挥信息系统与技术 年份:2020
阐述了未来战争中无人集群协同作战的概念内涵和发展现状,分析了基于强化学习的无人集群协同的特点,提出了基于多智能体强化学习的集中训练-分布执行的无人集群协同设计方案,...
[学位论文] 作者:陶睿,, 来源:山东大学 年份:2020
强化学习是试错的艺术,通过不断的尝试来学习更好的策略。...近年来,强化学习在游戏、棋牌、机器人等领域展现出了强大的潜力,是机器人领域一个研究热点,基本思想是通过智能体(Agent)在环境中不断尝试,学习完成目标的更优策略,以达到从环境中获得奖励值更多的目的。...强化学习算法被许多人认为是走向通用人工智能道路的关键算法。本文针对DQN、Double DQN、Dueling DQN等强化学习算法在机器人导航这...
[期刊论文] 作者:熊丽琴, 曹雷, 赖俊, 陈希亮, 来源:计算机科学 年份:2020
基于值分解的多智能体深度强化学习是众多多智能体深度强化学习算法中的一类,也是多智能体深度强化学习领域的一个研究热点。...文中首先说明了进行值函数分解的原因;其次,介绍了多智能体深度强化学习的基本理论;接着根据是否引入其他机制以及引入机制的不同将基于值分解的多...
[期刊论文] 作者:陈鑫,王巍, 来源:科学与财富 年份:2020
强化学习是机器学习的一个分支,通过模拟人类学习的策略,利用积累的经验来改进决策系统的性能,经过不断地训练和试错,逐步提高智能体的决策能力.强化学习是人工智能的主流领...
[期刊论文] 作者:宋爱香,马冲, 来源:情报探索 年份:2020
[目的/意义]基于强化学习的图书内容推荐方法可解决传统推荐系统注重推荐列表的准确率,忽略图书推荐的多样性,且无法解决数据信息缺失的问题。[方法/过程]采用强化学习框架对...
[期刊论文] 作者:吴宜珈,徐鹏, 来源:火力与指挥控制 年份:2020
人工智能技术为未来战争提供新的博弈手段,强化学习作为人工智能技术的重要组成部分成为实现智能化作战的关键方法。简述了人工智能技术发展历程和强化学习算法原理,介绍了强...
[学位论文] 作者:曹茜,, 来源:北京交通大学 年份:2020
强化学习在近些年逐渐成为人工智能领域的一个研究热点,而且已经在游戏、控制、自然语言处理等领域取得了非常大的成功。面对越来越复杂的强化学习任务,为了提高数据的利用率...
[学位论文] 作者:潘俊方,, 来源:电子科技大学 年份:2020
如何表示数据和怎样自动发现options是强化学习面临的两个巨大挑战。近年来分层强化学习在解决“维数灾难”问题方面取得了显著进展,其主要思想是将任务层次分解为子任务,从而加速智能体的学习和规划过程。...子任务的自动发现问题已经成为分层强化学习研究领域的...
[学位论文] 作者:吕乃冰,, 来源:北京交通大学 年份:2020
机器学习是人工智能的基础和核心,而强化学习是机器学习研究领域的一个充满前景的方向。强化学习通过让智能体与环境交互生成样本,缓解了其他机器学习算法过于依赖样本数量的问题。...强化学习算法从生成的样本中汲取经验,根据经验继续交互过程,通过这一自学习的方式不断改进更新决策策略,逐步达到最优决策效果...
[期刊论文] 作者:丁志梁,潘毅群(指导),谢建彤,王尉同,黄治钟, 来源:建筑节能 年份:2020
提出了在空调系统运行优化中应用强化学习算法,主要采用拟合Q迭代算法。结合空调系统运行优化的实际需求及强化学习算法的特征,...
[学位论文] 作者:张泽功,, 来源:桂林电子科技大学 年份:2020
深度强化学习集深度学习的感知能力和强化学习的决策能力于一体,对于处理自动驾驶这种需要感知环境并进行驾驶决策的领域具有良好的适用性,所以利用深度强化学习算法进行决策技术的研究具有很重要的现实意义。...通过分析无人驾驶技术和深度强化学习技术的现状,针对不同深度强...
[学位论文] 作者:敖天宇, 来源:苏州大学 年份:2020
强化学习与深度学习结合的深度强化学习方法已成为人工智能领域的重要研究方向,目前在各种复杂决策控制任务中取得了举世瞩目的成果。...深度强化学习方法结合了深度学习特征表征能力与强化学习通用决策控制能力,不需要复杂监督数据,就能让智能体在环境中进行自主学习。在学习过程中,如何平衡“探索与利用”的关系成为了深度强化学习研究的热点问题。...传统深度强化学习算法通常采用一些相对简单且随机的探索策略,致使算法探索效率...
[期刊论文] 作者:丁志梁,潘毅群,谢建彤,王尉同,黄治钟,, 来源:建筑节能 年份:2020
空调系统运行优化是建筑节能的重要组成部分.提出了在空调系统运行优化中应用强化学习算法,主要采用拟合Q迭代算法.结合空调系统运行优化的实际需求及强化学习算法的特征,将...
[学位论文] 作者:刘露萍,, 来源:贵州大学 年份:2020
本文主要研究基于群体智能和强化学习算法求解Nash平衡.首先,将免疫记忆、自我进化机制引入到量子粒子群算法中设计一种求解Nash平衡的新型协同免疫量子粒子群算法,通过概率浓度选择公式来保持种群的多样性,...证明该算法是依概率收敛的.其次,将协同免疫量子粒子群算法分别应用于求解n人非合作有限博弈的Nash平衡和广义博弈的Nash平衡.最后,从强化学习的角度出发,针对多智能体随机博弈考虑用强化学习算法求解...
[学位论文] 作者:乔彦铭, 来源:天津大学 年份:2020
研究基于深度强化学习的认知雷达波形选择方法,对于推进认知雷达的智能化水平具有重要意义。论文设计了基于深度强化学习(DRL)的认知雷达波形选择(优化)方法框架。...为解决传统强化学习对环境的感知和表示能力不足的问题,利用DRL来适应雷达任务复杂多变电磁...
相关搜索: