基于视觉词汇的物体检测方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:Michellesy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物体检测是计算机视觉领域的一项重要技术。一般来说,物体检测的目的在于检测图像或视频中出现的特定语意对象,例如行人,建筑,人脸等。其中的一些领域,如行人检测和车辆检测等,已经有了较深入的研究。然而,目前流行的物体检测方法很少考虑大数据情况下物体检测的问题,比如需要在大型图像数据库中快速检测并定位图像中出现的某种物体的情况。“视觉词袋”是近年来在图像检索领域里十分流行的一种图像表示方法。简单而高效是这种方法的主要特点。该方法的核心是将图像的局部特征聚类形成“视觉词汇”,并将图像表示成包含视觉词汇的视觉文档。由于视觉词汇的可索引性,基于视觉词汇的图像检索与匹配算法一般具有快速高效的特点。本文提出了一种基于视觉词汇的物体检测方法,以达到在大型图像数据库中实现快速物体检测的目的。方法利用潜在语意分析(LSA)找到视觉词汇中的“关键词”,并基于关键词对目标物体的结构建立了模型,最终使用这种模型实现基于霍夫变换的物体检测。本文同时也对解决视觉词汇同义性和多义性问题进行了讨论。本文提出的检测方法对缩放和旋转变换具有不变性,并且对于遮挡,杂乱背景具有稳定性。在最后本文讨论了检测方法在检测不同种类的物体的准确性和效率,并分析了该方法的适用范围和应用前景。
其他文献
随着现代无线通讯、移动网络、普适计算、分布式信息处理等技术的迅速发展,位置感知计算和基于位置的服务(Location Based Services,LBS)在实际应用中越来越重要。全球定位系统
在计算机以及互联网技术的迅猛发展推动下,软件产业也迎来了空前的繁荣,但同时也带来了新的问题:软件盗版以及非法复制变得越来越猖獗。软件水印是一门新兴的研究软件版权保
自动文本分类技术是自然语言处理关键技术之一,简单的说文本分类技术是根据文本的不同特征,将具有相同特征的文本划分到同一个类别当中。自动文本分类是在人工基础上演变过来的
在计算机视觉中,对于像素级的图像的物体识别,定位和显著性检测方法的提速,可以通过将原本像素级的方法应用到超像素级,从而达到更快,更好的完成算法的任务。本文提出一种网
信息技术的高速发展带动了社会各行各业的改革和创新,产业信息化已经是当今各产业的发展方向,旅游业在此浪潮中发展尤为迅猛。游客的个性化需求不断提高,给以旅行社为中心的传统
学位
数字图像加密技术是保护图像信息安全一种有效手段。当面对海量的图像数据时,安全高效的加密算法将至关重要。本文以现有图像加密算法和目前最为新颖的GPGPU技术为基础,对图像
图像中的显著性区域检测是图像处理领域和计算机视觉领域中的热点讨论和研究的问题,已广泛应用于图像与视频分割、目标检测与识别、图像检索、图像分类和机器视觉等方面;其次,
钢铁已经成为汽车制作、机械化工、船舶制造、军事国防等工业必须的原材料。但是由于落后的轧制设备、以及不发达的工艺技术等诸多原因,使得钢铁表面容易产生辊印、粘结、压
经过近三十年的实际应用和技术研究,虚拟仪器技术已经成为21世纪仪器技术、传感器技术、计算机技术以及网络通信技术一个重要的发展方向。虚拟仪器的“软件就是仪器”这一核心思想使软件仪器模块作为独立仪器模块的建立成为可能,并且为基于虚拟仪器思想的公共软件平台的搭建提供了强有力的支持。本文借鉴虚拟仪器的思想,以冰箱性能测试为研究对象,构建了一套易于定制、扩展性良好、集成化的冰箱测试系统。本文对现有的冰箱测试