基于视觉认知的目标识别技术研究

被引量 : 5次 | 上传用户:xzjwl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习、模式识别和计算机视觉等领域,目标识别一直是最具挑战性的难题之一。研究目标识别技术是解决目标跟踪、行为理解和场景分析等复杂视觉任务的基础,具有重要的实用价值和理论指导意义,已成为非常重要的研究热点和难点。目标识别是利用计算机对图像进行处理、分析和理解,获取感兴趣的目标或区域相关信息的技术。研究目标识别技术的最终目标是,使计算机像人脑视皮层一样快捷高效地“读懂”图片的内容,引领我们进入更加智能的未来。这也促进了对生物视觉认知机制及其智能性进行研究的兴趣。尤其是在复杂恶劣环境下,需要处理视觉信息时,传统的基于统计学习的计算机视觉方法遇到较大困难。鉴于此,如何从视觉认知的角度去研究和设计计算机视觉算法成为一项迫切而又富有挑战性的任务。本文主要针对生物视觉认知系统的关键环节—分层最大化和学习机制开展研究工作,在深刻理解其运行机制和原理的基础上,将其运用于目标分类、识别系统,并在静态2D图像数据集和连续帧2D图像数据集上对优化的算法模型进行性能评估和分析,取得了重要的进展。首先,研究了两个经典的基于生物视觉的计算模型HTM(分层时序模型)和HAMX(分层最大化模型)。然后,结合视觉认知机制重新设计优化了传统的计算机视觉模型。具体研究内容如下:(1)针对传统目标识别模型存在通用性差、目前尚未与视觉认知机制有效结合等难题,首先对HMAX和HTM两个仿脑模型进行了计算理论层次与算法设计层次上的分析,指出其本质上和计算机视觉模型的原理对应关系。然后,详细分析了视觉认知理论在目标分类、识别中的应用。(2)针对光照突变导致识别时检测率低的问题,提出结合优化的同态滤波算法,设计了基于Patch的更具区分性的LBP特征,改进后的算法应用于目标识别系统,实验结果验证了优化后算法的有效性和可行性。(3)针对遮挡情况下,有效检测目标,并同时能识别出遮挡目标的可见部分是目前面临的一个主要挑战,研究该方向有具有一定的理论指导意义和实际工程价值。针对上述难点本文提出结合外观特征和帧间运动信息对目标进行显式遮挡建模的方法。该方法将基于单帧的部件级目标检测与基于连续帧的目标遮挡估计相融合,解决了因为可利用信息不足导致识别性能不高的难题,有效提升了遮挡情况下的目标检测率。(4)针对传统的视皮层前馈分层模型仅局限于探讨目标分类问题,提出了一种面向多视角目标检测的视皮层前馈分层模型。该模型采用基于视角的目标表达方法,通过增加一个简单单元层来表达目标的不同视角,增加一个复杂单元层来表达不同视角简单单元的投票结果,从而完成视角不变的目标检测。学习方面,在原有的底层特征分片学习的基础上,该模型在高层增加了对视角的学习,从而形成一个两层的学习结构,这一结构可以有效的提高学习的效率。在PASCAL VOC2011数据集上的测试结果表明,改进后的模型性能与传统的计算模型相比,取得了更好的检测效果。(5)针对被检测目标在视角变化和遮挡时较难识别的问题,提出利用多特征融合的方式来降低视角的干扰,联合利用Gabor特征和视角变换时共有的LIOP特征(Local Intensity Order Pattern)对目标进行多角度识别的新算法。首先,利用二维Gabor滤波器组对输入图像进行滤波,得到含有方向信息的Gabor特征响应图,进而通过相关算法得到具有尺度及平移不变的特征向量。其次,通过几何变换算法获得不同视角下的LIOP特征向量。然后,为了降低时间复杂度,通过主成分分析算法(principal component analysis)对联合特征降维。最后,把降维后的特征向量输入支持向量机(SVM)进行训练学习,得到检测器模型。综上,本文针对在复杂场景下,传统目标识别存在一定局限性的问题,围绕如何利用、模拟生物视觉认知机制的特性。对传统的目标分类、识别领域等关键问题和算法模型进行探索和指导,初步实现了基于视觉认知的目标识别功能,完成课题既定研究任务,并取得了阶段性成果。为进一步的算法研究提供了理论基础,对研究生物视觉和计算机视觉也具有一定的借鉴意义。
其他文献
关于人性问题中的"罪"、"恶"问题,荀子和奥古斯丁分别从唯物观中对人性自身的认识和西方宗教神学的不同立场出发,提出了"性恶论"和"原罪论"来阐释自己对人性、对罪与恶问题的
目的探讨综合护理干预在四肢创伤骨折术后疼痛护理中的应用效果。方法将178例四肢创伤骨折患者按随机数字表法分为2组:对照组89例,采用常规护理方法;观察组89例,在常规护理基
改革重组后,中散集团形成了“一个决策中心、两个经营平台、三家管理公司”的崭新组织架构。如何建立流转顺畅、运行高效、具有激励和约束作用的全新管理体制机制,成为中散集团
<正>波伏娃与丁玲,虽同为女作家,可一般想来,她们是难有交集的。原因不外是国家有别,相距太远;从声望角度考量,波伏娃无论如何也是世界的。在寻常情况下,说波伏娃阅读并评说
数学是高职学生和高中生必须学习的课程之一,数学可以帮助高职学生和高中生锻炼思维能力,提高实际生活中解决问题的能力。本文主要通过研究高职数学教学与高中数学教学之间的
海域评估是对海域资源价值的评定,已成为海域资源合理利用的基础性工作,而海域定级在海域评估中具有基础又重要的地位。为了推进海域物权管理和海域有偿使用的进程,促进海域
犯罪团伙的组织结构对置身其中的未成年人具有重要影响。根据在北京、湖北、贵州三省市未成年犯管教所进行的问卷调查,未成年人犯罪团伙中半数有成年人参与,一些团伙被成年人
CCTV主楼底板混凝土达到了12万m3,厚度达到10.9m。项目从配合比设计、混凝土制备、现场组织和质量控制措施等多方面进行了充分研究,形成了超厚大体积混凝土施工技术,并得到了
无论发达国家还是发展中国家,中小企业都是经济发展和社会稳定的重要支柱。改革开放以来,我国中小企业在提高市场效率,促进经济增长,创造就业机会,出口创汇,激励科技创新,带
目的了解助产士的临床决策意识现状并分析其影响因素。方法采用护理临床决策量表和评判性思维能力测量表对全国范围内抽取的583名助产士进行横断面调查,并进行临床决策意识影