论文部分内容阅读
如今深度学习被越来越多的人所熟知,应用也更加广泛,计算机视觉领域中大多数模型都是深度学习网络。深度学习网络效果的好坏关键在于训练,其目标是训练出一个模型,并用这个模型去进行一系列的预测。训练深度学习网络离不开大量数据集,现有的数据集的大小和复杂度已落后于模型容量的增长,若训练并应用新的模型,数据将成为一个问题。获取数据最常见的方法是人工获取并标注,但这是一种较复杂、高成本的获取方式,并且当需求大量数据时,获取的速度较慢。因此将容易获得的数据转换为目标数据的方案被提出,该方案解决了高成本、获取难、获取速度慢等问题,接下来只需要研究如何更好的转换数据。早已被提出的循环生成对抗网络便可实现以上所述的转换功能,即跨域图像合成。该网络由两个生成器和两个判别器组成,生成器与判别器之间通过互相博弈而达到共同进步的目的。使用训练后的生成器生成的图片却存在较多问题,其中尤为突出的问题是图片的视觉内容在跨域过程中无法较好的保留,使得跨域后的图片与其标签中的各个对象无法对应。因此本文提出了一个标签保留生成对抗网络(LPGAN)加上图片滤波操作,能较好的保留跨域前后图片中的内容信息,将每个物体的边缘强化,如此生成的图片会与其跨域前的标签文件一一对应,跨域的数据能更好的被目标检测网络识别为目标数据。标签保留生成对抗网络主要以循环生成对抗网络为基础,将该网络与语义分割网络结合,并在损失函数中加上带权交叉熵函数,以语义分割损失结果约束跨域前后图片中内容信息的变化。本文所提出的方案分为两步:1)训练标签保留生成对抗网络,并生成跨域图片;2)对跨域图片进行滤波操作,使图片更加平滑,边缘更加清晰。按照本文中所提出的方案实验,所生成的图片确实能实现跨域图片对目标检测网络训练后检测统一测试集时可得到更高的平均精度均值,从而证明了本文中方案的有效性。