DDPG相关论文
V2X是车联网典型应用的核心技术,合理的资源调度策略能有效提高V2X网络性能,以满足智能化、安全性的要求。这不仅需要资源调度的实......
移动边缘计算(MEC)系统中,因本地计算能力和电池能量不足,终端设备可以决定是否将延迟敏感性任务卸载到边缘节点中执行。针对卸载过程......
随着无人机近年来的迅猛发展,各类型无人机在各行各业的运用越加广泛。大型无人机因其相较于传统货运机更为低廉的成本以及广阔的......
近几年,随着汽车工业的迅速发展,“新四化”的浪潮席卷整个汽车行业。“智能化”作为“新四化”的关键部分,自然成为了当前的研究......
自动驾驶技术一直是人工智能领域研究的热点之一。传统模块化方法受限于驾驶环境的复杂,难以做出系统性设计;基于监督学习的深度神......
投资组合问题是金融管理中的一个常见问题,投资者将资产按照一定比例不断地重新分配到不同产品。同时,在控制风险的情况下保证投资......
无人驾驶是汽车行业未来的发展方向,而决策模块是限制其发展的重要环节。由于强化学习是通过智能体与环境交互产生控制命令,同时考......
主动悬架系统因对不同路面与外界扰动的实时适应能力,具有较强的车辆平顺性控制潜力,近年来得到了汽车厂商与学者的广泛研究。传统......
导航即规划路线并控制机器人从当前位置移动至目标位置,是移动机器人的核心功能之一,随着移动机器人进入各行各业,其面对的环境更......
随着通信技术的发展,现代战争逐渐成为海陆空联合的信息战争,作战中的信息交互也从简单的指令扩展到文本、实时侦察图像和视频等多......
随着汽车的普及,出行越来越便捷,但交通意外伤亡人数也在逐年攀升,人工智能被视为防止由人为因素导致的交通事故的有效解决方案。......
2019年,国内民航年旅客量达到13亿以上,同比增长6.9%。随着空域拥挤问题日趋严峻,航空业面临巨大挑战,包括空管人员的压力激增、航......
采煤机是综采工作面的核心装备,复杂煤层条件下,其工况恶劣、环境复杂,采掘装备智能化程度不高,导致我国煤矿开采灾害多、煤机适应......
随着化石能源消耗的日益加剧、社会用电需求量的不断增加、电力设备老化等问题的不断出现,倡节能减排,推动可持续发展势在必行。由......
随着智能制造业和工业4.0的不断发展,机器人正逐渐应用于复杂的装配任务,然而传统机器人技术难以满足实际应用需求。近年来,在人工......
强化学习是机器学习领域的一个重要分支,它通过模拟生命体大脑的学习思维模式来学习行动策略。与传统的学习方法不同,强化学习中的......
随着人工智能技术的不断发展,传统的机械臂应用变得越来越智能化,其中的一个关键智能化提升就是使机械臂获得在非结构化空间环境中......
Driving in the complex traffic safely and efficiently is a difficult task for autonomous vehicle because of the stochast......
Consortium blockchains-based deep deterministic policy gradient algorithm for optimal electricity tr
To achieve higher energy utilization and lower generation cost for renewable sources (e.g.,wind and solar energy),much w......
在排水系统的控制算法领域中,目前已有的技术路线是先对排水系统进行数学建模,再结合一些经典的控制算法如比例-积分-微分(PID)算法......
针对智能车辆在轨迹跟踪过程中的横向控制问题,提出一种基于强化学习中深度确定性策略梯度算法(Deep Deterministic Policy Gradie......
强化学习被越来越多地应用到推荐系统中.提出一种基于DDPG融合用户动态兴趣建模的推荐方法(DDPG-LA),使用LSTM网络提取用户的长期......
涡轮增压有“涡轮迟滞”的问题,可变几何截面涡轮增压器(Variable Geometry Turbocharger,VGT)是解决“涡轮迟滞”的一个好方法,但......
超密集网络(UDN,ultra-dense network)作为解决物联网中移动流量需求爆炸增长问题的关键技术之一,在通过大量部署小型基站(SBS,Sma......
目前,自动驾驶已经成为车辆工程领域的研究热点并引领着未来的产业化方向,其中高可靠性的智能化决策控制是相关技术领域的关键所在......
飞行器的自主智能避障一直是无人机领域的研究热点。相对于平面运动物体来说,飞行器的空间信息,以及对于避障的态势动作的控制更加......
任务型对话系统是对话系统领域的分支之一,旨在采用自然语言的方式帮助用户完成某一特定任务,如今在个人助理、客服等方面有着广泛......
随着社会的飞速发展和人们生活水平的不断提高,人们对电力行业智能化的发展提出了更高的要求。其中,微电网技术能够提高分布式发电......
在路径规划领域已经涌现出了诸多的优秀的经典算法,但这些传统方法往往基于静态环境,对于动态可变环境缺乏处理能力.本文提出一种......
仿人形机器人是机器人领域的重要分支,本文结合深度确定性策略梯度算法(Deep Deterministic Policy Gradient)进行仿人型机器人的......
自动驾驶汽车是传感器、网络通信、导航定位、人工智能等多学科综合体,其中导航定位、路径规划、行为决策和车辆控制等是自动驾驶......
路径规划是人工智能领域的一个经典问题,在国防军事、道路交通、机器人仿真等诸多领域有着广泛应用,然而现有的路径规划算法大多存......
针对工业液压机械臂末端控制精度受惯性和摩擦等因素影响的问题,提出了一种基于深度强化学习的机械臂控制方法。首先,在机器人操作......
与传统腹腔微创手术相比,腹腔微创手术机器人进行手术具有创伤更小,术后恢复更快,便于实施等优点。建立微创手术机器人虚拟操作训......
在多智能体(agent)环境中如何应用强化学习的方法完成特定任务一直以来都是强化学习领域的一个难点,多个智能体之间有效的沟通和协......
DDPG算法是一种端到端的深度强化学习算法,主要用于解决仿真任务。DDPG能够在具有高维度动作空间的任务中取得接近人类的水平,然而......
深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)作为深度强化学习中的经典算法,在连续控制问题上有着较大的优......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
近年来,制造业的自动化程度不断提高,机器人在装配领域得到了越来越多的应用,但其中绝大多数是基于位置控制的,当面对装配对象结构......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
本文主要对多车队列协同纵向行驶的决策控制算法进行了一定的研究。区别于传统基于规则的控制方法,本文选择强化学习方法解决车辆......