基于深度神经网络与特征编码的图像分类

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:type
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类是计算机视觉的基础问题。随着人工智能和计算机视觉的蓬勃发展,越来越多的高校和企业投入了大量精力到图像分类研究中。顾名思义,图像分类是利用图像处理和人工智能的方法提取图像特征,然后确定图像的类别。传统的图像分类算法首先提取图像的颜色特征、纹理特征、形状特征、空间关系特征,然后训练一个分类器来对图像进行分类。传统图像分类算法的分类精度受到特征的典型性和区分性的限制。本文使用特征编码和多层空间特征金字塔来获得更全面和更具判别力的特征。本文的主要工作如下:(1)提出了一种基于深度网络高斯聚合编码的图像分类方法。首先利用深度卷积神经网络提取特征,然后将提取到的特征进行高斯聚合编码,最后将编码后的特征输入到全连接层对图像进行分类。该方法将深度学习与高斯聚合编码进行结合,使所获取的用于分类的特征有更加丰富的语义信息同时该特征具备一定的稀疏性,实验结果表明,所提出的算法具有更高的分类准确率。(2)提出了一种基于深度网络多层空间特征金字塔模型的图像分类方法。网络底层特征主要表示基础语义信息,高层特征描述的是对图像分类更具判别力的复杂语义信息,通过多层空间特征金字塔的方式将底层特征和高层特征有效融合,然后将融合后的特征输入到全连接层进行分类。该方法将图像信息的特征表达更全面和具体,在此基础上训练图像分类网络模型可以达到更高的分类精度。(3)提出了一种基于OpenCL并行加速的图像分类方法。首先构建实时分类轻量级卷积神经网络模型,然后通过指令矢量化的方式优化卷积神经网络的每一层,实现网络各层的并行加速。该方法基于开放运算语言(OpenCL),适用于CPU,GPU,FPGA等多种异构系统。实验结果表明,该方法图像分类效率在GPU(GTX 1080)平台可达到每秒229幅图像,在FPGA(Stratix 10)平台可达到每秒25幅图像,图像分类精度均为93%。
其他文献
近年来,随着大众对信息保护越来越重视,信息安全成为大家重点关注的问题,信息隐藏技术作为信息安全的分支在防伪和保证秘密信息的安全传输等方面有着广泛的应用。传统信息隐
当下,青年志愿服务活动涉及社会、环境和生活等方面,从扶贫到社区共建,从公共服务到教育支持,其服务的领域与影响的范围不断扩大。本文的研究对象定位为益阳市青年志愿服务事
随着信息时代的飞速发展,个人隐私泄露事件层出不穷,越演越烈。社交网络作为一个共享的平台,分享在社交网络中的资源可能被多个分享主体所共有,为了防止隐私泄露,每个社交网
近年来网络媒体极具时效性的报道成为了网民收到信息的主要途径。网络媒介的互动特征已经成为影响受众舆情的重要手段。VK是一个以发布与分享信息为核心的网络传播平台,由于
顶点覆盖(Vertex Cover)是无向图G=(V,E)的一个顶点子集,使得图G中的任意一条边都至少存在一个顶点属于该子集。最小顶点覆盖问题(Minimum Vertex Cover)的目标是找出包含顶
研究目的:通过对比全脑型体育教学模式和传统体育教学模式在5-6岁儿童体育教学中的差异,寻找全脑型体育教学模式对儿童体育教学的优势,比较分析两个班儿童各个所测试指标,探
水下通信技术在国家海洋军事实力建设与海洋资源探测等领域扮演着重要角色,随着国与国之间的竞争愈演愈烈,水下通信技术成为一个热门研究领域。实现水下数字通信系统中信号的盲检测对水下通信技术的发展有着举足轻重的作用。基于Hopfield神经网络(Hopfield Neutral Network,HNN)的盲检测算法由于不依赖统计量,直接对接收信号进行盲检测恢复出原始发送信号,利用神经网络的非线性,自适应性
推进教育均衡发展是新时代我国教育改革的主旋律,教育均衡是区域发展的主要影响因素。校长轮岗是政策与体制相融合发展的具体产物,分析校长轮岗并强化校长轮岗制发展,促使校
宰我是孔子门下四科“十哲”之一。为言语科之首,其便辞巧说在《论语》及其他文献中多有体现,喜提出问题并对此与孔子进行辩论,故颇受教责。文献所载之宰我生平扑朔迷离,尤其
人类对于外部世界的认识通常是基于多种感知的综合响应,例如视觉、听觉、触觉等等。多模态数据是同一事物在不同形式下的展现结果,通过融合这些数据可以更加深入的了解事物的本质结构。在多模态融合中,传统的模型通常会忽略分析样本重要性对于模态融合的影响。在本文中,引入自步学习模型来改善这一问题。自步学习模型与人类教育过程类似,将样本按易学到难学进行排序然后逐步进行训练。本文的研究内容是基于自步学习的多模态融合