【摘 要】
:
传统的基于内容图像检索往往是提取图像的底层视觉纹理、颜色和形状等特征,然后利用特征距离评价并排序输出结果,然而,这种方法往往达不到人们的要求,存在人类与机器理解差异
论文部分内容阅读
传统的基于内容图像检索往往是提取图像的底层视觉纹理、颜色和形状等特征,然后利用特征距离评价并排序输出结果,然而,这种方法往往达不到人们的要求,存在人类与机器理解差异的语义鸿沟问题,这也是图像检索技术研究的难点。为了研究此类问题,本文在尝试改进课题组局部不变特征点和视觉注意模型的情况下,探索了有监督SVM机器学习方法和无监督PLSA概率潜在语义分析模型,同时开发完善出一套检索测试系统。本文的主要研究工作如下:
(1)基于显著图的加权前背景分离检索方法。提出基于显著图下,将图像的显著和非显著区域分离,并分别统计纹理和颜色特征,再通过前背景加权以及特征间加权的方式融合进行检索。在统计过程中主要利用了LBP纹理特征和HSV-72维颜色特征,并将结果与传统的方法进行实验比较分析。
(2)基于SVM分类模型的图像检索研究。本文为了建立底层特征与高层语义间的联系,在传统的图像检索流程中,加入机器学习分类层面。本文主要构建并融合了颜色分类SVM模型和纹理分类SVM模型。其中SVM模型中选用HOG(Histogramof Oriented Gradient)局部不变描述子,颜色特征的选择是分块三阶颜色矩,并将融合后的模型指导于图像检索,平均分类准确率达到85%,与传统的方法比较结果显示大多数情况下不仅仅检索效果更优而且检索的结果更加符合人类的语义理解。
(3)基于概率潜在语义模型的图像检索研究。为了在图像检索中引入机器的语义理解,本文研究了概率潜在语义分析模型,让机器自动学习并进行语义分类。概率潜在语义模型中关键的一个步骤是将图像特征模拟成文本单词,主要是将特征提取并聚类特征成为视觉单词,并统计每个图像中包含的每一种视觉单词的个数形成词频表,最后让PLSA模型自动学习训练库中的视觉单词词频表,并按照要求的语义得到每个图像在语义上的概率分布。
同时,使用C++,SQL Server2000,Visual Studio2010,Opencv2.3.1开发完善出本文的测试检索系统,并提供传统的一些算法进行对比实验。
其他文献
随着计算机网络与通信技术的发展,普通数字签名已经不能满足各种电子签名的需要,一些具有特殊性质、满足特殊需求的数字签名成为认证技术的重要研究方向。群签名就是一种具有
随着三维测量技术的不断发展,通过数字扫描设备能够有效的获取现实世界中物理物体的高精度表面模型,并成为获取3D点云数据的主要手段。三维点云模型已经被广泛应用于模式识别
随着多媒体技术和制造三维模型软件的飞速发展,传统的一维和二维的多媒体数据已经无法满足人们的生活需要,三维的多媒体数据类型获得了人们越来越多的关注。生活中众多领域广泛
随着物联网技术(TheInternetofthings)的高速发展,无线射频识别装置(WirelessRadioFrequencyIdentificationDevices)得到越来越多的应用,其相应的射频识别(Radiofrequencyide
图像拼接技术是图像处理技术中的重要研究领域,是结合计算机视觉与计算机图形学,以及图像处理和虚拟现实等领域的一个研究课题。现在的科学技术的发展迅速,图像拼接技术已经
随着计算机图形处理技术与硬件技术的快速发展,虚拟现实技术被广泛地应用于3D游戏、虚拟制造、虚拟仿真等领域。阴影作为虚拟现实的一种重要的表现方法,能够向观察者提供场景中
随着科学技术的发展,科技项目研究成果不断的涌现,对这些项目进行的科技评审,是否能合理规划科研资源变得越来越为人们所关注。科技评审工作的开展已逐步由原有的“计划审批”向“同行评议”的方法转变。评审工作的公平与公正也逐渐成为人们关注的热点。如何保证这些科研项目的评审能更加客观、公平、公正的进行,是科技评审研究中的重要课题。论文从科技评审的公平与公正出发,提出了科技评审的评分偏差模型,通过对评分偏差的计
软件定义无线网络(Software-Defined Wireless Networking,简称 SDWN)是一种新的无线网络架构,它将软件定义网络(Software-Defined Networking,简称SDN)的思想应用于无线网络
随着地震勘探技术正向多维、多参数、多分量、高分辨率方向发展,获取的地震勘探数据量也越来越大,这给存储器的存储容量、计算机的处理速度以及远程网络的传输带来了极大的压
经过对车载影音/导航综合系统在国内外行业以及高校的研究状态、技术特点进行分析,研究了基于嵌入式技术为核心的内嵌式车载影音/导航系统的构成、实现原理,结合项目实际需求对