论文部分内容阅读
计算机科学和互联网的发展,使得数据挖掘与机器学习技术得到空前关注。多数机器学习算法依赖于有标记数据,而人工标注成本较高,许多应用中缺少有标记数据,迁移学习技术应运而生。本文主要研究了迁移学习中的零样本学习方法,迁移学习技术在未知雷达辐射源识别中的应用以及强化学习在雷达干扰决策中的应用。首先,本文研究了基于线性兼容性函数的零样本学习算法。通过使用考虑了类别差异的损失函数,并且加入直推式的局部学习算法进一步修正模型。现有的基于线性兼容性函数的零样本学习算法的损失函数对错分给不同类别以相同的损失,忽略了不同类别之间存在的差异。因此,使用差异化的损失函数可以使源域模型能够更好地适应目标域的分类任务。然后引入直推式的局部学习方法,利用目标域样本潜在的分布信息与结构特点,减少投影域漂移问题带来的影响,从而提高分类效果。实验表明,改进后的算法分类性能有一定的提升,局部学习方法可以显著提高分类准确率。其次,研究了基于迁移成分分析的未知雷达辐射源识别方法。本文首先对未知雷达辐射源识别问题进行了分析,通过专家知识将已知雷达辐射源和未知雷达辐射源联系起来,用基于高斯混合模型的新类别检测方法将测试样本中的已知雷达辐射源数据和未知雷达辐射源数据区分开来。然后用迁移成分分析方法将已知类数据和未知类数据进行域适应变换,用变换后的数据预测样本的调制方式与工作模式。最终用基于贝叶斯法则的二阶段方法确定样本所属的雷达辐射源类别。最后,研究了基于Q学习的雷达干扰决策算法。本文首先分析雷达干扰决策中的关键问题:雷达工作模式特点、干扰样式对雷达工作模式的影响和干扰效能评估方法。针对雷达干扰决策问题的特点建立相应的强化学习模型,目标雷达工作状态对应状态空间,雷达干扰样式对应动作空间。根据不同雷达状态受到不同干扰的不同表现,建立状态转移概率模型和奖赏函数模型。然后用模型无关的Q学习算法在建立的雷达干扰环境模型中自主地学习干扰策略。根据雷达对抗环境中快速学习的要求,引入自适应的学习率,提高算法收敛速度。实验结果表明,Q学习算法可以在环境中学习到最优的干扰策略,改进后的算法收敛速度较快。