搜索筛选:
搜索耗时0.1623秒,为你在为你在12,250,000篇论文里面共找到 57 篇相符的论文内容
类      型:
[期刊论文] 作者:杨惟轶, 白辰甲, 蔡超, 赵英男, 刘鹏,, 来源:计算机科学 年份:2020
强化学习作为机器学习的重要分支,是在与环境交互中寻找最优策略的一类方法。强化学习近年来与深度学习进行了广泛结合,形成了深度强化学习的研究领域。作为一种崭新的机器学...
[期刊论文] 作者:徐聪, 李擎, 张德政, 陈鹏, 崔家瑞,, 来源:工程科学学报 年份:2020
谷歌的人工智能系统(AlphaGo)在围棋领域取得了一系列成功,使得深度强化学习得到越来越多的关注.深度强化学习融合了深度学习对复杂环境的感知能力和强化学习对复杂情景的决...
[学位论文] 作者:邹启鸣,, 来源:哈尔滨工业大学 年份:2020
强化学习算法是机器学习的一个重要分支,主要研究如何利用智能体与外界环境的交互数据学习完成特定任务的控制策略。...由于强化学习算法要求模型能够表征高度复杂的策略,因此利用表现力极强的深度神经网络作为策略表征的深度强化学习算法逐渐成为主流。...虽然深度神经网络较大的参数空间使得深度强化学习算法掌握高度复杂的技能成为可能,但是这也使其学习过程需要大量的交互数据才能够达到良好的学习效果。深度强化学习算法的采样低效...
[学位论文] 作者:许瀚,, 来源:哈尔滨工业大学 年份:2020
卫星本身具有非线性、参数耦合等导致建模比较困难的因素,所以鉴于此,本文利用深度强化学习算法为卫星姿态了一种不依赖于卫星精确模型的控制器。...针对该问题,本文基于深度强化学习控制思想,以卫星姿态控制为蓝本,研究深度强化学习算法在控制领域的...
[期刊论文] 作者:朱昆, 刘蓉, 王美清,, 来源:福州大学学报(自然科学版) 年份:2020
针对金融资产未来收益的随机性,结合强化学习的原理,以Q-learning算法构造强化学习框架,来解决投资组合优化问题.采用一只股票连续数日开盘价和收盘价的涨跌幅信息作为状态,...
[期刊论文] 作者:杨贺淞,, 来源:电子世界 年份:2020
本文提出了一种在无线体域网(Wireless Body Area Networks,WBANs)中,基于强化学习的动态频谱分配方案。...我们使用强化学习中基于Q值迭代的Q-Learning算法,在感知的信道池中以...
[期刊论文] 作者:孙彧, 曹雷, 陈希亮, 徐志雄, 赖俊,, 来源:计算机工程与应用 年份:2020
多智能体深度强化学习是机器学习领域的一个新兴的研究热点和应用方向,涵盖众多算法、规则、框架,并广泛应用于自动驾驶、能源分配、编队控制、航迹规划、路由规划、社会难题...
[学位论文] 作者:何超,, 来源:苏州科技大学 年份:2020
本研究以解决当前建筑设备控制策略的局限性,利用强化学习能够通过迭代不断调整控制策略,从而得到最优策略,实现建筑节能为中心。深度强化学习算法收敛需要大量的数据,而空调系统现有的监测数据有限,严重影...
[期刊论文] 作者:李铭浩, 张华, 刘满禄, 李新茂, 周祺杰,, 来源:传感器与微系统 年份:2020
针对机械臂突发单关节故障的情况,提出一种基于深度强化学习的机械臂容错控制方法。在建立环境模型和奖罚机制的基础上,针对机械臂正常运行和故障运行的情况,使用无模型的强...
[期刊论文] 作者:李跃, 邵振洲, 赵振东, 施智平, 关永,, 来源:计算机工程与应用 年份:2020
现有基于深度强化学习的机械臂轨迹规划方法在未知环境中学习效率偏低,规划策略鲁棒性差。为了解决上述问题,提出了一种基于新型方位奖励函数的机械臂轨迹规划方法A-DPPO,基...
[学位论文] 作者:马留龙,, 来源:哈尔滨工业大学 年份:2020
强化学习是一种智能体从与环境的不断交互中学习的算法,适合于连续决策的任务,是目前无地图导航的主要研究方向。本文研究了基于强化学习的...
[学位论文] 作者:陈建华,, 来源:燕山大学 年份:2020
本文重点研究了基于深度强化学习的机械臂的路径规划和位姿规划,针对机械臂的运动规划训练时间长和训练样本多的问题,进一步提出了具有迁移学习的深度强化学习的机械臂运动规划算法。...
[期刊论文] 作者:陈树德, 彭佳汉, 高旭, 赖晓晨,, 来源:现代计算机 年份:2020
由此,提出一种基于深度强化学习的信号灯...
[期刊论文] 作者:张景玲, 冯勤炳, 赵燕伟, 刘金龙, 冷龙龙,, 来源:计算机集成制造系统 年份:2020
为了更高效地求解物流优化领域中的有容量车辆路径问题,减少陷入局部最优的情况,提出一种基于强化学习的超启发算法。设计了算法的高层启发式策略,包括选择策略和解的接受准...
[期刊论文] 作者:于金亮, 涂山山, 孟远,, 来源:计算机工程 年份:2020
基于移动雾环境下的物理层密钥生成策略,提出一种基于强化学习的伪装...
[学位论文] 作者:王佩,, 来源:电子科技大学 年份:2020
作为机器学习三大主流算法之一的强化学习近些年来发展迅速。强化学习模拟了智能体与环境之间的交互,通过与环境之间的交互,不断尝试,获...
[期刊论文] 作者:李锋, 陈勇, 王家序, 汤宝平,, 来源:计算机集成制造系统 年份:2020
为了解决当前人工智能预测方法在滚动轴承状态趋势预测中预测精度较差、计算效率较低的问题,提出基于强化学习单元匹配循环神经网络(RLUMRNN)的滚动轴承状态趋势预测新方法。...
[学位论文] 作者:刘洋军,, 来源:电子科技大学 年份:2020
与此同时,自AlphaGo之后,深度强化学习在近两年来...
[学位论文] 作者:掌静,, 来源:南京邮电大学 年份:2020
理解视频中群体人物的行为语义是人工智能领域的难点,主要任务要求运用深度学习、强化学习等算法整合序列化的人物动作线索来推理视频群体人物的行为语义。...
[学位论文] 作者:韩雪,, 来源:中国地质大学(北京) 年份:2020
基于强化学习的多智能体协作近年来已被证明是解决此类问题的较优范例之一。多智能体通信是实现多智能体协作的最常用方法之一。但是,现今多数...
相关搜索: