基于GAN和VAE的聚类算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ludongyan900209
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类算法是指根据数据的关联性,将相似数据划分至相同数据簇,而将相异数据划分至不同数据簇的过程。随着计算机深入到人们日常生活中,互联网上每天都会产出海量的数据,但这些数据大多数是不包含标签的。给这些海量数据做人工标注非常耗时费力,所以目前较为成熟的有监督学习算法面临着训练数据匮乏的问题。因此使用无监督学习中的聚类算法,根据样本之间的相似性对其自动分组具有非常重要的研究意义。传统的聚类算法只能提取数据的浅层特征,不能有效挖掘出隐藏在数据中的更深层次非线性特征,并且计算复杂度随着数据规模的提升而急剧提升。相较之下,深度学习聚类算法通过深度神经网络提取数据更为抽象的特征,降低了计算复杂度,提高了聚类精度。深度学习聚类的算法主要使用了自编码器模型,也有少量研究工作使用生成对抗网络。自编码器模型将数据域和隐空间做一一对应的映射,所以泛化能力较弱。假如只使用小样本数据训练模型,则对整体数据的聚类精度不佳。生成对抗网络具有比自编码器更强的泛化能力,当数据样本小或者有少量噪声数据扰动时,生成对抗网络的性能比自编码器稳定一些。但是使用生成对抗网络做聚类的研究工作较少,仍处于起步阶段。因此本论文针对以上问题,对基于生成对抗网络和变分自编码器的聚类算法进行研究,主要内容如下:1.针对图像数据聚类的问题,提出Info-Cluster-GAN模型。在原有生成对抗网络生成器和判别器的对抗基础上,增加了一个深度神经网络构建的分类器。分类器将使用不同隐空间变量生成的数据映射至不同类别,该操作使得生成数据与隐变量互信息最大化。从而可以使用低维的隐空间变量表示高维的数据类别。在初步实现对生成数据的聚类功能之后,利用期望最大化算法更新分类器参数,来提升模型对真实样本的聚类精度。此外,本模型通过使用Wasserstein距离替换相对熵来衡量生成样本和真实样本之间的差异,使得模型收敛性得到提升。为了优化模型的训练速度,本模型采用了两种方式。其一是使用多损失函数代替交替训练各个神经网络。其二是共享判别器和分类器之间的网络参数,该方法减小了网络复杂度,节省了模型训练时间。实验表明,本模型的聚类精度比起现有的基于生成对抗网络的聚类模型,得到了进一步的提升。2.针对使用单一高斯分布噪声生成的数据存在模式崩塌的问题,采用降噪变分自编码器来生成混合高斯噪声分布。具体地,使用隐变量作为训练数据训练降噪变分自编码器。生成不同类别数据时,通过编码器和隐变量,生成不同分布的混合高斯噪声信号。在不同的高斯分布中采样信号作为生成器输入,以此避免单一的噪声输入带来的模型崩塌。对优化后的模型进行了加噪数据的聚类实验,证明了模型有相对较好的抗噪抗干扰能力,且聚类精度比优化前模型有所提升。
其他文献
随着航空航天技术的发展,飞行器以超声速、高超声速飞行时外表面在空气粘性阻滞作用下温度急剧升高,传统结构材料无法承受过高的热载荷造成飞行器表面烧蚀。液态金属良好的导热性和流动性为此提供了解决方案。频率选择表面(Frequency Selective Surface,FSS)是一种周期阵列的空间电磁波滤波器,可以选择性反射或透射特定波段的电磁波,改变电磁波的传输特性。利用液态金属良好的导电性能和流动性
基于微波光子学的信道化接收技术与传统的电子学信道化技术拥有明显的优势,可以适应在日趋复杂的电磁环境中进行高频率大带宽的信道化接收。信道化接收首先需要将频域上的宽带信号划分若干窄带信号,然后通过对窄带信号的处理间接地实现了对宽带信号的处理。由于微波光子学具有很大的处理带宽和很小的传输损耗,因此微波光子的信道化接收机可以解决电域信道化接收机中存在的问题。光子集成技术可以大幅度降低微波光子系统的体积重量
随着军事形态的不断演变与电子技术水平的不断发展,雷达作为战争中的主要信源,一直是该领域学者们的关注重点。在现代雷达系统中,其部件阵列天线备受人们重视。本文依托实际工程需求,设计了一款X波段阵列天线,该天线具有低副瓣、高增益、尺寸小、重量轻的优良性能,可在方位面形成和差波束,在俯仰面进行电扫描。本文在调研国内外研究现状及掌握相关基本理论的条件下,根据设计指标确定了天线的阵面分布及尺寸,包括行天线间距
极化(Polar)码是第一类被证明可达二进制输入离散无记忆信道(Binary-input discrete memoryless channels,B-DMC)对称容量的信道编码方案,自被提出后就受到学术界与工业界的广泛关注。SCL译码算法以及各种级联Polar码方案的提出,包括CRC-Polar码,PC-Polar码,Hash-Polar码等,有效地提升了Polar码的误码率性能,使其能够比肩L
随着现代科技的不断发展,基于雷达图像的舰船目标检测识别算法也层出不穷。经典深度学习目标检测识别算法虽然在精度上有着不错的表现,但其检测速率依然达不到许多军事应用的要求。而且由于雷达图像的特殊性,在实际应用中我们很难得到大量的雷达图像样本。因此,基于小样本的雷达图像舰船目标检测识别是一个富有挑战性也极具意义的研究课题。针对此课题,本文采用了生成对抗网络结合舰船目标三维电磁散射信息的方法,对舰船目标进
在偏远地区与“一带一路”沿线国家的边境地带,一直存在着通信基础设施匮乏、地域广阔而人口分布不集中的现象。随着“一带一路”的推进,更多的通信研究者注意到那些发生在跨境地质复杂区的自然或人为灾害,特别是那些对通信基础设施具有严重破坏性的不可控灾害,往往会加剧人民生命、财产的损失。监测设备集群能够持续更新、上传观测到的灾害信息,但这些地区并不适合部署监测设备集群。重大灾害发生后,如果处于这些区域的通信基
不论是军事领域亦或民用领域,导航的地位都在日益提高,人们对导航的依赖日益增强。其中捷联惯性导航系统(Strapdown Inertial Navigation System,SINS)由于其结构简单,设备容易集成,一经提出便迅速发展,已经在很多领域展开应用。SINS工作主要可以分为三步:传感器数据的校准、初始对准以及惯导解算更新。其中,初始对准是非常重要的一环,对准结果的精度直接影响最终的导航结果
作为移动通信不可或缺的重要领域,卫星通信的历史由来已久,应用前景广阔。其中,反射面天线因其高增益、功率容量大与结构稳定等优势一直是卫星通信中应用最为广泛的天线形式之一。常见的单反射面天线有前馈反射面与偏置反射面之分。近年来,系统化、多频段以及小型化需求逐渐成为反射面天线主要的研究趋势。而反射面天线的多频段化实际上就是对馈源系统的多频段工作要求。基于此,本文将馈源系统的多频段设计作为研究目标,以下是
近来,伴随着以Deepfake为代表的人工智能视频合成伪造技术取得的一系列成果,我们正在进入一个难以分辨真假图像的世界。人脸合成、面部身份互换、面部属性伪造和面部表情伪造四种人脸伪造技术正在广泛应用于视频类消费娱乐领域,但同时也在为虚假色情、假新闻、恶作剧和金融欺诈等方向不断提供支撑。伪造技术的各类负面应用引发广泛的社会担忧,检测假脸成为了学术界的热点问题。伪造检测领域中,深度学习已经成为在检测D
随着深度学习的发展,大规模的遥感影像和自然影像数据集让图像分割算法在更多领域得到应用,但是样本的多样性也给分割算法带来了一定的挑战,其中如何解决跨尺度特征融合以及多尺度目标分割一直都是学术研究的热点。考虑到现有基于深度学习的图像分割算法存在的问题,本文针对目标分割的难点,从特征提取网络、高分辨图像恢复、几何特征学习等方面提出了改进方法。主要研究内容如下:1、提出一种基于自适应提升小波融合网络的多尺