基于粒子群优化算法的小样本图像增广方法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:mawenbo111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类是如今计算机视觉中的一个研究方向。深度学习作为一种主要研究方法,因网络架构的深度复杂性使得其具有强大的函数拟合能力,但对于小样本图像数据集,仍然有着过拟合问题。要解决过拟合问题既可以优化网络结构,也可以增加训练图像。如今大量的研究致力于网络结构的设计和优化,而较少关注寻找图像的增广方法。例如,2012年提出的运用在Image Net数据集上的基本图像增广方法仍作为数据预处理的标准。这些基本的图像处理方法只对于特定的数据集有效,运用到其他数据集上时鲁棒性较差。对比于收集更多实际的图像数据,图像增广不需要花费大量的人力物力,因此被广泛应用于物体分类识别的任务上。以往图像增广的实现方式都是基于对图像的基本处理,这些增广方式仅仅假设了图像有着旋转、平移和尺度缩放不变性等基本特性,与具体图像中的数据内容无关。如今,模型复杂以及计算机计算性能瓶颈时,图像增广作为一种能够对分类性能进行突破的手段,有着其研究与发展的必要性。针对小样本图像数据量较少、不均衡的特点,本文对图像增广问题从优化的角度进行了建模,将其建模成在图像特征空间最优分布的优化问题。通过分析优化目标以及约束条件,提出了以粒子群优化算法的迭代思想作为原型的图像增广方法,在算法原型上根据一定规则约束进行像素空间优化。研究的需求假设是,对于进行增广的图像类别,其主要特征一般服从正态分布。优化目标为图像特征空间的正态分布满足均值的不变,以及标准差的增加,搜索策略是对两种元策略的组合。算法的决策空间为特征空间,优化结果该空间内的一组解以及其对应的图像。算法根据图像类型的特点设计增广策略,通过中间迭代的结果作为新生成图像,构造出分布更为均衡的数据,缓解深度神经网络的过拟合问题。实验部分通过对omniglot数据集以及mini-imagenet数据集中部分具有代表性的类别进行图像增广。与较新的图像增广增强方法通过控制变量的方式进行对比,本文的算法能够得到特征分布更广泛、更为均衡的增广图像。通过对实际应用场景下的旗帜图像进行增广,有效缓解小样本图像在深度学习方法中的过拟合问题,提升了模型的准确率。
其他文献
随着时代的发展,世界人口爆炸式增长与人口老龄化所衍生出的一系列问题受到人们的重视,中老年人等特定人群的健康保健问题亟待解决。然而,传统的集中式医疗监控方法在对病患
供需失衡本身是一个中性的经济学概念,供给和需求总是在价格机制调节下不断向均衡状态收敛。然而,对配置效率和动态效率形成严重抑制作用的长期结构性供需失衡现象表明,我国的价格机制、竞争机制和产业进入退出机制仍存在制度性缺失和发展性障碍。当前我国制造业长期结构性供需失衡可以从高新技术产业和传统产业两个维度来分析,其中高新技术产业的供需失衡是发展性障碍造成的,主要表现为技术供给不足、过度进入、市场培养有限等;传统产业的供需失衡是制度性障碍造成的,主要表现为落后产能过剩、品牌效应不足等。为解决制造业长期结构性供需失衡
慢性阻塞性肺病、肺气肿、肺癌等肺部疾病严重威胁人类的健康和生命安全。肺功能定量评估对于肺部疾病诊断和治疗具有重要意义。基于肺部组织分割的肺功能评估系统能够对全肺
由于现代网络环境的复杂性以及多媒体数字产品的透明和易操作性,各种盗版、非法篡改、恶意传播越来越容易操作,严重危害了多媒体信息的安全。数字水印技术因其能解决以上问题,成为研究的热点。经奇异值分解得到的奇异矩阵,因稳定性强而被广泛应用到数字水印算法中。但目前,大多数的基于奇异值分解的数字水印算法存在一定的虚警率问题,且固定的嵌入因子不能同时兼顾不可见性和抵抗多种外界攻击。本文针对奇异值分解存在的虚警率
缓冲区溢出是一种非常普遍并且危险的漏洞,在各种操作系统和应用软件中广泛存在。利用缓冲区溢出攻击,可以导致程序运行失败、系统宕机、重新启动等后果。更为严重的情况可以
随着互联网及社交网络的快速发展,微博信息更新速度爆炸增长,用户需要通过平台获取自己感兴趣的内容,然而庞大的信息流使用户面临“信息过载”的问题。基于这样的场景,分析挖掘用户的兴趣倾向,从而实现精准提供高质量、用户感兴趣的个性化信息及商业广告推送服务,对平台及用户都是行之有效的方法。在微博平台中,用户既存在长期的兴趣点,也会根据时间和当下流行事物的变化,产生短期的新生兴趣,而且随着互联网的发展,博文数
近年来,伴随互联网的快速发展以及生活节奏的加快,人们越来越习惯于从互联网平台中获取和分享信息,这也导致网络中产生了大量的短文本信息。一些内容分发、信息检索、社交网
近年来,随着科学技术的飞速发展,对数据处理技术提出了全新的、更高的要求。在多传感器系统中,由于传感器的测试精度、数据的采集成本、系统组成的多种环节以及外部环境等因
森林对于生态系统的可持续发展起着关键作用,而森林火灾的发生严重威胁着生态系统发展。林火发生初期,由于树木的遮挡,火焰很难被发现,但烟雾却易被监控视频采集。相对传统的
TNM临床分期是癌症诊断及治疗的关键步骤,但由于临床分期需要依赖大量不同来源的信息,而供医生决策的时间有限,很难准确地提取分期相关信息,因而目前临床分期存在较大偏差。