【摘 要】
:
端到端的驾驶决策是无人驾驶领域的研究热点.本文基于DDPG(Deep Deterministic Policy Gradient)的深度强化学习算法对连续型动作输出的端到端驾驶决策展开研究.首先建立基于
【机 构】
:
北京工业大学信息学部,北京交通大学电子信息工程学院,北京市物联网软件与系统工程技术研究中心
【基金项目】
:
国家自然科学基金(No.61502018)
论文部分内容阅读
端到端的驾驶决策是无人驾驶领域的研究热点.本文基于DDPG(Deep Deterministic Policy Gradient)的深度强化学习算法对连续型动作输出的端到端驾驶决策展开研究.首先建立基于DDPG算法的端到端决策控制模型,模型根据连续获取的感知信息(如车辆转角,车辆速度,道路距离等)作为输入状态,输出车辆驾驶动作(加速,刹车,转向)的连续型控制量.然后在TORCS(The Open Racing Car Simulator)平台下不同的行驶环境中进行训练并验证,结果表明该模型可以实现端到端的
其他文献
针对异构网(Heterogeneous Network,HetNet)无线回程,现有研究主要集中于提升网络吞吐量,而对回程覆盖性能研究较少.由此,本文构造了一种在小小区基站(Small cell Base Stati
为优化单相全桥逆变器的效率,提出了一种新型单相全桥软开关逆变器,其输出端设置了1组与负载并联的辅助电路.在辅助电路处于工作状态时,逆变器桥臂上的主开关能完成零电压软
针对空间信息网络中节点高速运动导致的网络拓扑结构难以长期稳定的问题,本文提出了基于代数连通度优化的网络动态拓扑控制方法,通过少量链路调整来维持网络拓扑的稳定性.为