DDPG 相关硕士博士期刊学术论文

DDPG相关论文

基于5G新空口技术的车联网智能资源调度策略研究

V2X是车联网典型应用的核心技术,合理的资源调度策略能有效提高V2X网络性能,以满足智能化、安全性的要求。这不仅需要资源调度的实......

学位

5G NR 车联网资源调度超短时隙 DDPG

基于异步奖励深度确定性策略梯度的边缘计算多任务资源联合优化

移动边缘计算（MEC）系统中，因本地计算能力和电池能量不足，终端设备可以决定是否将延迟敏感性任务卸载到边缘节点中执行。针对卸载过程......

期刊

边缘计算任务卸载资源联合优化动态带宽分配 DDPG

大型无人机融合空域安全运行问题探索性研究

随着无人机近年来的迅猛发展,各类型无人机在各行各业的运用越加广泛。大型无人机因其相较于传统货运机更为低廉的成本以及广阔的......

学位

大型无人机融合空域运行碰撞模型深度强化学习 DDPG

基于强化学习的自动泊车算法研究

近几年,随着汽车工业的迅速发展,“新四化”的浪潮席卷整个汽车行业。“智能化”作为“新四化”的关键部分,自然成为了当前的研究......

学位

自动泊车强化学习 DDPG SAC

基于深度强化学习的端到端无人驾驶决策算法研究

由于近数十年来我国经济水平的快速稳定发展,我国的城镇化发展进程得到明显加快,人均机动车保有量不断提高,但同时也一并面临着日......

学位

无人驾驶端到端深度强化学习强化学习决策 DDPG

基于深度强化学习的自动驾驶系统设计与实现

自动驾驶技术一直是人工智能领域研究的热点之一。传统模块化方法受限于驾驶环境的复杂,难以做出系统性设计;基于监督学习的深度神......

学位

自动驾驶深度强化学习异构融合特征 DDPG 概率图模型奖励函数

基于深度强化学习的投资组合优化研究

投资组合问题是金融管理中的一个常见问题,投资者将资产按照一定比例不断地重新分配到不同产品。同时,在控制风险的情况下保证投资......

学位

DDPG TD3 投资组合股票市场深度强化学习

结合环境状态预测模型的无人驾驶决策研究

无人驾驶是汽车行业未来的发展方向,而决策模块是限制其发展的重要环节。由于强化学习是通过智能体与环境交互产生控制命令,同时考......

学位

无人驾驶决策环境状态预测模型 DDPG EP-DDPG TORCS

基于深度强化学习的车辆主动悬架控制研究

主动悬架系统因对不同路面与外界扰动的实时适应能力,具有较强的车辆平顺性控制潜力,近年来得到了汽车厂商与学者的广泛研究。传统......

学位

主动悬架系统深度强化学习 DQN DDPG

基于深度强化学习的移动机器人路径规划研究

近年来,移动机器人在人们的生产生活中得到了广泛应用,路径规划作为移动机器人领域的关键技术之一,对于实现机器人自主移动具有重......

学位

路径规划深度强化学习 DDPG 人工势场纯跟踪激光SLAM

基于深度强化学习的移动机器人导航研究

导航即规划路线并控制机器人从当前位置移动至目标位置,是移动机器人的核心功能之一,随着移动机器人进入各行各业,其面对的环境更......

学位

导航机器人智能强化学习 DDPG

SPMA协议智能优化设计计技术研究

随着通信技术的发展,现代战争逐渐成为海陆空联合的信息战争,作战中的信息交互也从简单的指令扩展到文本、实时侦察图像和视频等多......

学位

战术数据链 MAC SPMA 排队论 DDPG

基于TORCS仿真平台的无人驾驶策略学习方法研究

随着汽车的普及,出行越来越便捷,但交通意外伤亡人数也在逐年攀升,人工智能被视为防止由人为因素导致的交通事故的有效解决方案。......

学位

TORCS平台深度强化学习 DDPG 无人驾驶模拟退火法

基于多维状态动作的DDPG冲突解脱算法研究

2019年,国内民航年旅客量达到13亿以上,同比增长6.9%。随着空域拥挤问题日趋严峻,航空业面临巨大挑战,包括空管人员的压力激增、航......

学位

空中交通管制冲突探测与解脱深度强化学习 DDPG

复杂煤层条件下采煤机自适应截割控制策略

采煤机是综采工作面的核心装备,复杂煤层条件下,其工况恶劣、环境复杂,采掘装备智能化程度不高,导致我国煤矿开采灾害多、煤机适应......

期刊

自适应截割控制多领域建模与协同仿真双向耦合自适应加权融合模糊控制 DDPG 机-电-液-控一体化

基于深度强化学习的建筑电力能源调度方法研究

随着化石能源消耗的日益加剧、社会用电需求量的不断增加、电力设备老化等问题的不断出现,倡节能减排,推动可持续发展势在必行。由......

学位

强化学习深度强化学习 DQN DDPG 建筑电力能源调度

基于多模态感知与学习的机器人自主装配技术研究

随着智能制造业和工业4.0的不断发展,机器人正逐渐应用于复杂的装配任务,然而传统机器人技术难以满足实际应用需求。近年来,在人工......

学位

机器人装配深度强化学习多模态感知技术视觉定位 DDPG

基于策略梯度的深度强化学习算法优化

强化学习是机器学习领域的一个重要分支,它通过模拟生命体大脑的学习思维模式来学习行动策略。与传统的学习方法不同,强化学习中的......

学位

强化学习深度强化学习策略梯度 DDPG TD3

基于深度强化学习的机械臂智能控制

随着人工智能技术的不断发展,传统的机械臂应用变得越来越智能化,其中的一个关键智能化提升就是使机械臂获得在非结构化空间环境中......

学位

机械臂位置控制深度强化学习 DDPG

Autonomous driving in the uncertain traffic—a deep reinforcement learning approach

Driving in the complex traffic safely and efficiently is a difficult task for autonomous vehicle because of the stochast......

期刊

autonomous driving complex traffic scenario DRL DDPG

Consortium blockchains-based deep deterministic policy gradient algorithm for optimal electricity tr

To achieve higher energy utilization and lower generation cost for renewable sources (e.g.,wind and solar energy),much w......

期刊

SG DDPG consortium blockchain social welfare non-profit security analysis

基于强化学习的排水系统控制算法仿真与研究

在排水系统的控制算法领域中,目前已有的技术路线是先对排水系统进行数学建模,再结合一些经典的控制算法如比例-积分-微分（PID）算法......

学位

排水系统强化学习 CVaR DDPG SAC 溢流量

基于强化学习DDPG的智能车辆轨迹跟踪控制

针对智能车辆在轨迹跟踪过程中的横向控制问题,提出一种基于强化学习中深度确定性策略梯度算法(Deep Deterministic Policy Gradie......

期刊

汽车工程轨迹跟踪 DDPG 智能车辆强化学习神经网络

融合用户兴趣建模的智能推荐算法研究

强化学习被越来越多地应用到推荐系统中.提出一种基于DDPG融合用户动态兴趣建模的推荐方法(DDPG-LA),使用LSTM网络提取用户的长期......

期刊

强化学习推荐系统 DDPG DDPG-LA LSTM 注意力机制长期兴趣短期兴趣

WSN中面向目标跟踪的节点协同移动算法研究

基于无线传感器网络(Wireless Sensor Network,WSN)的目标跟踪技术一直以来都是研究热点之一。但传感器网络资源受限,制约了目标跟......

学位

无线传感器网络目标跟踪运动协同 DDPG 任务调度

基于DRL的可变几何截面涡轮增压器控制及仿真分析

涡轮增压有“涡轮迟滞”的问题,可变几何截面涡轮增压器(Variable Geometry Turbocharger,VGT)是解决“涡轮迟滞”的一个好方法,但......

学位

VGT 自适应学习深度强化学习 DDPG CFD仿真

基于深度强化学习具有能量收集和协作的超密集网资源分配

超密集网络(UDN,ultra-dense network)作为解决物联网中移动流量需求爆炸增长问题的关键技术之一,在通过大量部署小型基站(SBS,Sma......

学位

吞吐量能源收集超密集网络深度强化学习 DQN DDPG MADDPG

基于WGAIL-DDPG的车辆自动驾驶控制策略

目前,自动驾驶已经成为车辆工程领域的研究热点并引领着未来的产业化方向,其中高可靠性的智能化决策控制是相关技术领域的关键所在......

学位

自动驾驶模仿学习深度强化学习 DDPG

基于DDPG的飞行器智能避障仿真应用研究

飞行器的自主智能避障一直是无人机领域的研究热点。相对于平面运动物体来说,飞行器的空间信息,以及对于避障的态势动作的控制更加......

期刊

智能避障强化学习 DDPG

基于双目视觉的双足机器人运动控制研究

双足机器人因其运动灵活性、对环境的良好适应性、可代替人类完成任务的优良特性得到了许多研究人员的关注,随着人工智能的兴起,人......

学位

双足机器人立体匹配卷积神经网络 DDPG ROS

基于深度强化学习的面向任务型对话管理研究

任务型对话系统是对话系统领域的分支之一,旨在采用自然语言的方式帮助用户完成某一特定任务,如今在个人助理、客服等方面有着广泛......

学位

任务型对话系统对话管理强化学习 DDPG 世界模型

个性化微电网能量管理策略研究

随着社会的飞速发展和人们生活水平的不断提高,人们对电力行业智能化的发展提出了更高的要求。其中,微电网技术能够提高分布式发电......

学位

个性化微电网能量管理功率预测 LSTM DDPG

结合LSTM的强化学习动态环境路径规划算法

在路径规划领域已经涌现出了诸多的优秀的经典算法,但这些传统方法往往基于静态环境,对于动态可变环境缺乏处理能力.本文提出一种......

期刊

自动编码器 LSTM DDPG 强化学习动态路径规划

基于DDPG的仿人形机器人仿真研究

仿人形机器人是机器人领域的重要分支,本文结合深度确定性策略梯度算法(Deep Deterministic Policy Gradient)进行仿人型机器人的......

期刊

强化学习 DDPG 人形机器人

一种基于公平性的无人机基站通信智能资源调度方法

空天地一体化网络是未来6G的关键内容。结合高精度波束赋形,无人机(UAV)的视距链路(LoS)可很好地作为空天地一体化网络的补充,但地......

期刊

无人机基站资源调度 DDPG 公平通信参数噪声

基于深度强化学习的自动驾驶决策方法研究

自动驾驶汽车是传感器、网络通信、导航定位、人工智能等多学科综合体,其中导航定位、路径规划、行为决策和车辆控制等是自动驾驶......

学位

自动驾驶深度强化学习 DDPG SAC TORCS

基于DDPG算法的路径规划研究

路径规划是人工智能领域的一个经典问题,在国防军事、道路交通、机器人仿真等诸多领域有着广泛应用,然而现有的路径规划算法大多存......

期刊

路径规划深度强化学习 DDPG ActorCritic 连续动作空间 path planning deep reinforcement learning DD

一种深度强化学习的机械臂控制方法

针对工业液压机械臂末端控制精度受惯性和摩擦等因素影响的问题,提出了一种基于深度强化学习的机械臂控制方法。首先,在机器人操作......

期刊

机械臂深度强化学习 DDPG 控制精度 robot arm deep reinforcement learning DDPG control accuracy

微创手术机器人操作的虚拟训练仿真及自主学习研究

与传统腹腔微创手术相比,腹腔微创手术机器人进行手术具有创伤更小,术后恢复更快,便于实施等优点。建立微创手术机器人虚拟操作训......

学位

医疗机器人训练仿真强化学习 DDPG

基于深度强化学习的高效能云任务调度算法研究

云计算是现代信息社会重要的基础设施,云任务调度作为云计算中最重要的一项技术,直接关乎用户和云服务提供商的利益。传统的云任务......

学位

深度强化学习云计算云任务调度 DQN DDPG

基于强化学习的多智能体协作策略研究

在多智能体(agent)环境中如何应用强化学习的方法完成特定任务一直以来都是强化学习领域的一个难点,多个智能体之间有效的沟通和协......

学位

强化学习深度学习多智能体 RNN DDPG Actor-Critic

基于层级深度强化学习的间歇控制算法

DDPG算法是一种端到端的深度强化学习算法,主要用于解决仿真任务。DDPG能够在具有高维度动作空间的任务中取得接近人类的水平,然而......

期刊

DDPG HDDPG 运动控制确定性策略梯度强化学习间歇控制

改进DDPG算法在自动驾驶中的应用

深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)作为深度强化学习中的经典算法,在连续控制问题上有着较大的优......

期刊

深度强化学习自动驾驶 DDPG 经验缓存分离 TORCS

基于学习的乒乓球机器人回球决策

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们......

学位

乒乓球机器人回球决策深度强化学习迁移学习 DDPG PNN

基于深度强化学习的机器人导航研究

随着扫地机器人、服务机器人与AGV的普及,室内移动机器人导航问题重新成为研究热点。室内移动机器人为了完成日趋复杂的各类任务,......

学位

室内导航 DQN及其变体 DDPG 迁移学习 ROS

视觉引导下的机器人卡合装配技术研究

近年来,制造业的自动化程度不断提高,机器人在装配领域得到了越来越多的应用,但其中绝大多数是基于位置控制的,当面对装配对象结构......

学位

视觉引导工业机器人卡合装配 DDPG 柔性装配

基于Deep Deterministic Policy Gradient的智能车汇入车流模型

ue＊M＃’＃dkB4＃＃8＃”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:（100084川C京市海淀区清华园申请人:清......

期刊

智能车汇入车流 DDPG 连续动作空间现实过程

Actor-Critic框架下一种基于改进DDPG的多智能体强化学习算法

ue＊M＃’＃dkB4＃＃8＃”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:（100084川C京市海淀区清华园申请人:清......

期刊

强化学习深度学习多智能体 RNN DDPG Actor-Critic

基于强化学习的多车队列纵向协同控制算法研究

本文主要对多车队列协同纵向行驶的决策控制算法进行了一定的研究。区别于传统基于规则的控制方法,本文选择强化学习方法解决车辆......

学位

强化学习 DDPG 多车队列协同自适应巡航

基于深度强化学习的自动泊车控制策略研究

目前汽车行业的发展重心正逐步由传统车辆向智能车辆转移,随之带来的是智能驾驶技术的迅速发展。自动泊车系统是智能驾驶技术的研......

学位

自动泊车运动学模型 DDPG 奖励函数硬件在环

看过本文同时还关注