论文部分内容阅读
胶囊网络在2017年10月被提出,是计算机视觉领域的一项最新技术,引起了学术界巨大的轰动。胶囊网络以向量的形式来表示部分与整体之间的关系,不仅能够以特征响应的强度来表示图像,并且能够表征图像特征的方向、位置等信息。胶囊网络的两层向量之间的更新采用动态路由算法,取代了传统卷积神经网络中的最大池化方法,能够避免图像精确位置信息的丢失。然而由于胶囊网络提出的时间还不长,还有一些不完善的地方。因此本文围绕胶囊网络,对其网络模型、训练方法以及应用等方面进行研究,有效结合卷积神经网络中的优化方法,进一步提高了胶囊网络的实用性,具体研究内容如下:(1)胶囊网络在手写数字等简单数据集上已经有很高的分类精度,为了能够让其在Android等移动设备中被实际应用,网络的参数量越少越好。本文为了降低网络的复杂度,提出了胶囊层之间共享参数的训练方法,并且重新设计了重构网络,采用反卷积网络结合Batch Normalization的优化方法,进一步降低网络的参数量。最后在MNIST手写数字数据集上进行实验,能够在基本保持原有的识别精度的同时大大减少网络的参数量,平衡了识别精度与网络复杂度之间的关系。(2)针对胶囊网络在彩色图像上识别精度还不是很高的情况,本文提出了一个更加有效的改进的胶囊网络—EfCaps。它主要由三个子网络组成,分别为特征提取网络、动态路由网络及重构网络。特征提取网络改进的部分在于采用不同大小的卷积核并行卷积来充分提取特征,获得不同感受野的特征组合;动态路由网络的改进在于采用1×1的卷积核对胶囊进行下采样,去掉冗余的胶囊,减轻网络的复杂度;重构网络采用与特征提取网络相同核大小的并行反卷积来恢复图像,并且与特征提取网络之间有两条跳跃连接,为了重构出更加逼真的图像以促进输出胶囊向量的识别作用。最后通过在CIFAR-10数据集上的实验证明,本文提出的改进的胶囊网络在识别精度上高出原来的网络5%,速度上也远优于原来的网络。(3)胶囊网络的输出是向量的形式,能够将具体类别的数据映射到潜在的向量空间上,并且通过这个向量能够很好地重构出像素级别的图像数据,并保留图像重要的特征。利用这个特性,本文将胶囊网络应用到数据生成上,提出了一个基于胶囊网络的条件自编码生成对抗网络模型,有效结合自编码器与生成对抗网络在数据生成中的优势。胶囊网络被用作条件自编码器,将样本数据映射到潜在特征表示空间,然后有两对生成对抗网络,一对是潜在向量空间的生成对抗网络,生成器采样均匀分布的噪声将其映射到胶囊网络表征的潜在向量空间,判别器判别向量是否来自于真实的胶囊网络表征的向量空间;另一对是样本空间的生成对抗网络,生成器将潜在向量空间的生成向量映射到样本空间,而判别器判别样本是否来自于真实的样本空间。在MNIST和FashionMNIST数据集上的实验证明,本文提出的条件生成模型能够生成更稳定、更清晰的样本,并且不会出现模式崩塌等问题,将胶囊网络用作条件自编码器更能够有效地将不同类别的样本映射到能够各自区分的潜在向量空间。本文对胶囊网络的模型、训练算法等方面进行了研究及改进,并且将其应用到图像生成上,为胶囊网络开辟了一个新的应用领域,同时也为胶囊网络以后的研究与发展提供了参考方向。