基于多通道的分层特征提取的图像识别

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:amdroid_JJ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像识别在模式匹配、计算机视觉、机器学习等研究领域都是一个热门的研究课题。经过多年的研究发展,图像识别领域已经形成了许多成熟的技术并且被广泛应用到遥感、航拍、车牌识别及监控等各个领域。在复杂的现实世界中,人们拍摄的许多图像都包含着多种维度的信息,比如轮廓,大小,视角,光照条件,场景布局等。如果图像识别主要关注的是对图像中对象的识别,那么图像中的光照、场景等信息就变成了干扰信息。当这些干扰信息太多的情况下,提取图像中的所需的有效特征就变的尤为困难。因此如何才能在提取图像的有效特征时不受干扰信息的影响,就变成了计算机视觉中是一个非常重要的问题。针对上述问题,本文提出了一种多通道下的分层特征提取算法,减轻了干扰信息对图像特征提取的影响,提高了算法识别率。本文的主要工作包括:(1)研究发现现有的字典学习算法K-SVD容易出现过拟合的现象,因此在K-SVD算法中引入相干性参数,降低了学习得到的字典中原子的相关程度,提升了字典的表述能力。实验结果表明,识别率比优化前提高2%-4%,Matlab和C-MEX混合编程的效率是Matlab版的23倍以上(2)分析了当前图像特征提取过程中比较主流的稀疏编码算法,对比匹配追踪算法和正交匹配追踪算法的优劣。然后将卷积网络中的空间金字塔池化应用到稀疏编码中,以降低了计算复杂度。(3)设计了多种通道对图像进行特征提取,即将图像按照不同的尺寸进行分割,每种分割方案(通道)在经过多层的特征提取后得到图像的特征向量。然后对不同通道的特征向量使用线性SVM训练模型,用于识别。实验结果表明,增加多通道并稀疏编码后的结果比别的特征提取算法识别率至少高出4%。
其他文献
图形用户界面(GUI, Graphical User Interface)以丰富的图形图像信息、简洁的操作方式与用户交互。随着嵌入式系统的广泛应用,高端消费类电子产品的已经迅速普及,而同时也要
Web服务在电子商务和企业应用集成中的作用日益突出,而服务发现是Web服务技术的核心和难点,是Web服务调用和组合的前提。Web服务发现是指服务请求者在候选服务集中查找与需求
大量案例显示,软件安全所面临的威胁来源不仅仅包括不可信的第三方实体,更包括那些怀有恶意的用户终端。针对软件知识产权的侵权行为,通常正是始于攻击者通过正当途径对目标软件
在21世纪这样的信息时代,数据库技术已经渗透到各种应用领域当中,互联网的快速发展推动着数据库技术应用的激烈变革。在信息数据量飙升的环境下,用户不再仅仅需求某种单一软
当前生产环境中的服务器协同工作方式普遍是多台服务器运行的简单叠加。在这种形式下,随着企业(尤其是大中型企业)对业务逻辑处理需求的与日俱增,只能通过盲目增置硬件设备来
日常生活中存在着复杂的动力学问题,振动状态纷繁复杂。由于建筑物或设备的异常振动而造成的事故时有发生,常常会给人类带来巨大的伤亡和损失,倘若我们可以在事故发生之前就
操作系统与应用软件的安全问题一直是学术界和工业界的研究重点与热点。如何防范与检测各种软件安全漏洞和恶意攻击则又是研究的重中之重。目前,研究者对常见的漏洞类型和攻击
自从第一个机器人诞生以来,机器人技术及智能化水平有了长足的发展,由于机器人本身综合了机构学、自动控制技术、人工智能、微电子技术、通讯技术,仿生学,传感器技术等多门学
人脸作为一种人体生物特征,具有难以伪造、不会遗失、随身携带、方便易用等特点。人脸识别在安全验证系统、档案管理、人机交互等方面有着巨大应用前景。传统的自动识别系统
伴随着嵌入式技术和网络技术的发展,嵌入式远程监控技术的研发不断深入,越来越多的企业和科研机构将视线投入到了远程监控领域中,其中安防领域是其关注的重点之一。本文就是