搜索筛选:
搜索耗时0.5132秒,为你在为你在102,267,441篇论文里面共找到 1,000 篇相符的论文内容
类      型:
[期刊论文] 作者:王金秋,孙晓松,秦华,, 来源:计算机测量与控制 年份:2013
针对爬壁机器人在地面与平整壁面环境中路径规划的研究,给出了一种基于k-最近邻(k-NearestNeighbor-kNN)分类法与强化学习算法相结合的爬壁机器人路径规划方法;基于强化学习算法...
[期刊论文] 作者:李棕,崔得龙,, 来源:电子设计工程 年份:2017
针对现有基于强化学习的云资源调度算法收敛速度慢的问题,在详细分析云作业执行流程后,采用了一种细粒度的云计算平台模型,设计了一种基于高斯过程回归和强化学习的云计算资...
[学位论文] 作者:吴睿,, 来源:吉林大学 年份:2018
深度强化学习是一种新的算法,它结合了深度学习和强化学习,以实现从感知到行为的端到端的学习。就像人一样,直接通过深度神经网络输入感知信息,如视觉和输出动作,而不需要手...
[期刊论文] 作者:吴宏杰, 戴大东, 傅启明, 陈建平, 陆卫忠,, 来源:计算机工程与应用 年份:2019
强化学习和生成式对抗网络是近年来人工智能领域的两个热门主题,在众多领域表现非常出色。近期出现较多关于两者结合的工作与报道,将强化学习交互式学习的优点与生成式对抗网...
[期刊论文] 作者:韦庆丹,陈焕文,陈鹏慧,蔡琼,, 来源:微计算机信息 年份:2011
本文主要研究了强化学习在机器人足球比赛半场进攻中的应用,机器人足球比赛环境状态是一个连续的状态空间,利用强化学习必须将状态空间离散化,文中利用给定的状态变量来描述...
[期刊论文] 作者:张汝波,周宁,顾国昌,张国印, 来源:机器人 年份:1999
本文采用强化学习方法实现了智能机器人的避碰行为学习.文中首先介绍了强化学习原理,讨论了采用神经网络实现强化学习系统的方法,然后对具有强化学习机制的智能机器人避碰行为学...
[学位论文] 作者:高令平,, 来源:大连理工大学 年份:2020
近年来随着深度强化学习的发展,越来越多的研究员尝试采用深度强化学习...
[学位论文] 作者:胡裕靖, 来源:南京大学 年份:2015
在人工智能和多智能体系统研究领域,多智能体强化学习是一种重要的学习技术。它作为强化学习、多智能体系统、博弈论等技术的综合,已经被成功地应用于机器人足球、宽带网络、Qo...
[学位论文] 作者:, 来源:南京信息工程大学 年份:2023
深度强化学习不仅可以给出投资者情绪的融合方式,而且可以找到有利的股票交易策略。...本文重点介绍了一种用于股票交易的多模态的深度强化学习策略,该策略包括了卷积神经网络(CNN)和双向长短期记忆神经网络(Bi LSTM)。首先,介绍的相关理论包括深度学习、强化学习和深度强化学习,为后续...
[学位论文] 作者:姚怡星, 来源:南京大学 年份:2006
强化学习是agent在与环境交互中通过“试—错”的方式以最优化长期收益为目标的机器学习方法,是介于监督学习和非监督学习之间的学习方式,它以其不需要事先了解环境以及不需要...
[学位论文] 作者:雷程佳, 来源:北京化工大学 年份:2020
强化学习的优化目标是寻找最优动作序列,解决复杂环境中的决策问题。...然而,在实际场景下训练和测试的强化学习问题的环境模型可能发生改变,以及强化学习和深度学习结合后难以准确和稳定地进行价值估计,都给深度强化学习带来了新的挑战。...
[期刊论文] 作者:史豪斌, 徐梦,, 来源:电子科技大学学报 年份:2019
针对旋翼无人机追踪场景中常用的PID控制方法与视觉伺服控制方法的不足,该文尝试将视觉伺服控制与强化学习结合,提出了一种基于强化学习的旋翼无人机智能追踪方法。首先使用...
[期刊论文] 作者:段勇,杨淮清,崔宝侠,徐心和,, 来源:机器人 年份:2008
主要研究了强化学习算法及其在机器人足球比赛技术动作学习问题中的应用.强化学习的状态空间和动作空间过大或变量连续,往往导致学习的速度过慢甚至难于收敛.针对这一问题,提出了...
[期刊论文] 作者:王长缨,尹晓虎,鲍翊平,姚莉,, 来源:模式识别与人工智能 年份:2005
Q学习算法是一种最受欢迎的模型无关强化学习算法。本文通过对Q学习算法进行合适的扩充,提出了一种适合于多agent协作团队的共享经验元组的多agent协同强化学习算法,其中采用...
[学位论文] 作者:朱昶熹,, 来源:华南理工大学 年份:2004
强化学习被广泛应用于解决序列决策任务。然而,强化学习算法的样本利用效率较低,并需要很长时间来学习合适的策略,特别是当多个智能体在没有先验知识的情况下开始学习。该问...
[期刊论文] 作者:李成严,孙巍,唐立民, 来源:哈尔滨理工大学学报 年份:2021
针对云资源调度问题,依据强化学习算法和云资源调度模型,建立了一种同时优化任务完成时间和运行成本的多目标云资源调度模型,并提出了一种权重自适应的强化学习算法对其进行...
[学位论文] 作者:陈刚, 来源:中南大学 年份:2012
本文以协作式多智能体系统为研究对象,研究应用强化学习进行多智能体协作行为学习时遇到的“维数灾难”问题。起源于单智能体系统的强化学习具有良好的自学习特性,为了提高多...
[学位论文] 作者:梁宸,, 来源:沈阳理工大学 年份:2020
在多智能体(agent)环境中如何应用强化学习的方法完成特定任务一直以来都是强化学习领域的一个难点,多个智能体之间有效的沟通和协调是迈向通用人工智能的重要手段。...目前很多传统的强化学习算法能够实现在简单环境下的单智能体学习,然而在多智能体环境中,由于环境的复杂性和动态性,学习过程遇到了很大的困难,会出现维数爆炸、目标奖励确定困难、算法不稳定难以收敛等问题。...
[学位论文] 作者:马杰跃, 来源:辽宁大学 年份:2021
强化学习算法善于解决序列决策问题,因此被广泛应用于学习路径推荐场景中。基于强化学习的推荐技术将推荐问题建模为序列决策问题。...相较于将推荐问题建模为分类问题和预测问题的传统方法,强化学习不仅考虑到用户的及时反馈,而且能够考虑...
[会议论文] 作者:高鹏, 毛秀华, 王栋, 张希, 来源:第十届中国指挥控制大会论文集(上册 年份:2022
深度强化学习可以实现自主交互循环决策,从而迭代提高目标解释算法的准确性,在图像智能分析领域具有重要的应用价值。结合遥感数据的特点,提出了一种基于深度强化学习的遥感图像目标检测算法。...构建了深度强化学习定位代理的决策过程,定位代理通过感知当前遥感图像和下一个需要关注的子区...
相关搜索: