论文部分内容阅读
近年来,随着人工智能技术的快速发展,智能车领域的研究也得到了广泛的关注。在智能车领域的研究中,不仅有硬件系统前沿技术的发展,而且车辆智能驾驶软件系统上的技术突破也起到至关重要的作用。整个智能驾驶软件系统包括环境感知、决策规划及控制等模块。在决策规划模块中,实现智能车的动态避障功能极其重要,在人-路-车的智能交通系统中,要实现智能车的安全行驶,必须保证智能车能实时的避开动态或静态的障碍物,然而目前为止智能车辆动态避障系统主要采用的是基于规则和传统的规划决策方法,在检测到障碍物的基础上,设定规则和实现规划算法让智能车辆避开障碍物,然而设计规则过程中很难满足所有的限制条件同时缺乏适应能力。另外,智能车所在不同的道路驾驶环境复杂多变,除智能车外的其他车辆及行人等交通参与者的行为也存在较大的多变性,因此本文以智能车辆行人动态避让为重点研究,开展了行人轨迹预测的深度学习(Deep Learning,DL)方法研究和智能车辆动态避障的深度增强学习(Deep Reinforcement Learning,DRL)方法研究。人类驾驶员在积累丰富经验后,能在感知、预测等方面做出合理的决策判断,但是人类会受到身体、心理等状态的影响,考虑到人类驾驶员的不足,另一方面智能驾驶系统拥有高精度的测量和计算能力,因此本文在基于深度增强学习的动态避障方法上也开展了人机协同共驾技术的探索与方法研究。本论文主要的研究成果及创新点如下:(1)提出行人轨迹预测的Social-Grid LSTM方法,该方法基于深度学习中的一种长短时期记忆网络模型(Long-Short Term Memory network,LSTM),结合了Social Pooling操作和Grid LSTM模型,其中Social Pooling操作主要是将行人之间的相互影响建立一种联系,采用Grid LSTM模型的原因主要是与相同层数的一般的LSTM模型相比较,损失函数的值收敛的速度较快,同时最后收敛的稳定值较小。并在公开的两个行人轨迹数据集中进行了训练与测试,与LSTM方法和Social LSTM方法进行了性能对比,实验对比结果显示所提出的方法能获得较小的预测误差。(2)改进提出一种基于深度增强学习Deep Q-Learning智能车辆动态避障方法,以行人为主要研究对象,作为动态障碍物,将智能车的状态数据及行人的状态数据作为增强学习(Reinforcement Learning,RL)中的状态(State),然后在设计的动作(Action)中包括了车辆的纵向和侧向的控制,在实验中考虑了车辆的动力学模型以贴近实车,经过在线的训练学习,能使智能车在不同速度下针对不同的场景拥有较好动态避障策略,避免了碰撞事故的发生,在设计实现算法的过程中,我们设计了两类经验池,包括拥有正负样本的经验池和只包含负样本的经验池,通过负样本的经验回放可以有效的针对碰撞情况进行训练,以提高动态避障策略的性能,并在Prescan软件上构建环境进行训练与测试,实验结果表明,设计实现的动态避障策略能达到较好的避障性能。(3)提出基于深度增强学习的人机协同动态避障方法,结合人机协同机制,设计一个安全限制条件。在人类驾驶员控制车辆的过程中,通过当前驾驶行为及车辆的状态预测,对比计算设计模型中的安全限制条件,然后在存在一定危险的情况下,即未满足安全限制条件,车辆的控制将切换到智能驾驶系统的动态避障策略,进而输出控制动作控制车辆的行驶,从而避免碰撞的发生,并在Prescan上搭建不同的场景进行了仿真测试与验证,实验结果表明,人机协同机制下能较好的实现人类驾驶员与智能驾驶系统对车辆控制的优势互补,紧急情况下实现智能车辆的动态避障,提高车辆的安全性能。