基于深度强化学习的双向装配序列规划

来源 :控制理论与应用 | 被引量 : 0次 | 上传用户:zgs352262
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决复杂装配模型的序列规划问题,并使算法对任意初始状态具有较高的适应性,本文提出了一种包含正向装配以及逆向拆解的一体化双向装配序列规划方法BASPW–DQN.针对复杂装配模型,首先进行了一体化装配序列规划的问题描述与形式化表示;在此基础上,引入了课程学习及迁移学习方法,对包含前向装配和逆向错误零件拆卸两部分过程的双向装配序列规划方法进行研究.在所搭建的ROS-Gazebo与TensorFlow相结合的仿真平台上进行了验证,测试结果证明此双向网络对于任意初始状态(包括零装配、部分装配、误装配等初始状态)的装配任务均可以在较少步数内完成,验证了所提方法对于解决装配序列规划问题的有效性与适应性.
其他文献
为提高大数据量情况下目标跟踪数据处理效率,将各传感器获取的目标测量值在时间轴上依次排列,利用成组序贯数据回归分析的目标跟踪方法,实现时间配准与目标跟踪的同步处理.首先对滤波曲线两点回归分析,逐一预测各观测点到达时刻的置信区间,筛选关联点;然后按系统处理周期分组,对关联点进行成组观测数据回归分析,计算出观测融合点,再用观测融合点更新滤波器新息;最后在Kalman滤波器框架下,实时更新运动方程,递推完成目标连续跟踪.仿真结果表明,本文时间配准跟踪方法能同步完成时间配准和目标跟踪,在节约资源的同时提高系统跟踪精
为提升毛泽东思想和中国特色社会主义理论体系概论课的时代感和实效性,首先分析了该课程的教学现状,然后提出了线上线下混合式教学实施方法,最后给出了课程教学效果与反思.教学实践表明效果较好,可为其他政治理论课教学改革提供借鉴.
针对当前工程设计中星地一体化指标分解不充分导致工程实现难度增大的突出问题,研究了姿态稳定度误差对星载聚束SAR成像质量的影响;在构建距离向与方位向姿态稳定度误差模型的基础上,分析了成像过程中姿态稳定度误差与成像质量指标之间的定量传递关系.理论分析和仿真结果表明,姿态稳定度误差会引入成对回波,姿态稳定度误差频率越高成对回波离主瓣越远,幅度越大成对回波的幅度越大,成对回波会导致SAR成像分辨率、旁瓣比等指标恶化.研究成果可为卫星方案设计阶段误差分配与指标体系构建提供理论支撑.
针对机载相控阵体制合成孔径雷达成像幅宽较窄的问题,根据高分辨宽测绘带成像的需求,提出了一种基于脉冲级捷变的宽幅成像控制方法.该方法通过脉间切换俯仰向波束指向,实现对多个测绘子带的回波数据采集,并分别进行成像处理,利用子带图像间的交叠区域进行子带图像拼接处理,从而在获得宽幅图像的同时,又保证了成像分辨率.实验结果表明,本文方法处理的图像可无缝拼接,实现了机载合成孔径雷达(SAR)大幅宽高分辨率的需求.
针对高分辨率雷达一维距离像(HRRP)的目标识别问题,提出了一种基于动态时间规整(DTW)算法的雷达目标识别方法.该方法利用HRRP具有反映目标结构分布和几何形状的特性,通过角域划分建立各类目标姿态模板数据库,使用DTW算法估计HRRP与目标模板库中不同HRRP的相似度,选择最大相似度对应的目标模板作为目标识别的结果.仿真实验结果表明该方法的有效性和鲁棒性.
针对通信类课程理实一体教学运用生硬等问题,首先探讨了基于认知过程的理实一体课程教学模式;然后结合雷达通信装备原理与实践课程,提出基于认知过程的理实一体通信类课程教学设计;最后给出了该课程教学效果与特色.教学实践表明,学员对理实一体教学内容、实施方法、提高学习兴趣和总体教学效果的认可程度分别达到95.9%、91.9%、89.8%和81.6%,取得了较好的教学效果.这可为其他课程教学提供有益借鉴.
为了进一步推进雷达对抗原理课程思政建设,分析了目前课程思政建设中存在的问题,提出了全方位了解学员情况、提高思政内容吸引力、增强思政内容说服力、进一步提升思政能力、改进思政库建设的应对措施,并进行了实践.实施效果表明,学员对课程思政的兴趣、军政素养、学习效果和满意度得到了有效提升.
针对地面及低空雷达目标识别中存在的雷达散射截面积小、回波幅度低、多普勒频移不明显等因素引起的目标特征被淹没难以检测识别的问题,提出了一种微多普勒特征与距离-多普勒特征融合识别方法.首先基于距离-多普勒二维矩阵,提出一种新型十字开窗目标检测手段,然后设计微动特征与距离-多普勒特征等多元特征提取方法,最后根据多元特征融合结果设计分类器进行目标分类识别.实验结果表明,相对于传统的运动、微动特征提取与分类,基于多元特征融合的分类器设计可以有效地提升地面及低空慢速小目标的识别准确率.
雷达情报分析与应用课程具有知识点多面广、理论性专、实践性强等特点.针对该课程的教学难点,提出了“三步三结合”教学模式,探讨了基于该教学模式的雷达情报分析与应用课程的教学设计,并进行了教学实践探索.教学实践结果表明,学员考核成绩有明显提升;该教学模式增加了教学内容的针对性和高阶性,缩短了课堂教学与岗位之间的距离,提高了实战化教学水平.这可为其他课程的教学改革提供参考.
针对预警情报系统在情报保障过程中存在的混沌不可控问题,基于混沌理论,对预警情报系统的混沌特性进行了分析,梳理出预警情报系统和混沌系统的映射关系,给出了预警情报系统的混沌模型,在此基础上提出了一种基于相互耦合的预警情报系统控制策略.仿真结果验证了本文方法的有效性.