基于“词袋”模型的图像分类系统

来源 :苏州大学 | 被引量 : 0次 | 上传用户:zlcz1025
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为图像检索、图像识别、图像过滤等方法的关键技术,基于内容的图像分类技术已成为模式识别领域中的一个重要研究方向,它的目的是将图像数据按照自身的语义特征进行分类,“词袋”模型在基于内容的图像分类领域中取得了很大的成功,因此越来越受到大家的重视。但是,在构建视觉词汇表的过程中,当前的很多方法只是简单的将底层特征进行聚类,并没有考虑图像区域之间的空间关系,这导致了词汇表不够准确和稳定。本论文引入和改进了几种能够结合空间信息的算法,用于构建视觉词汇表。本文的主要贡献在以下几点:首先,提出了一种演化SOM-SD算法对传统的SOM-SD的神经网络算法进行加速并用来进行图像分类。传统的SOM-SD算法的最大优点是它能够有效处理结构数据,区分相似度较高的对象。但是,由于引入了空间信息,SOM-SD计算量非常大,影响了其在大规模图像库上的应用。在保留SOM-SD处理结构数据能力的前提下,本文利用分层演化思想提高计算效率。实验证明:演化SOM-SD算法在图像分类性能上比没有考虑结构信息的传统算法有了明显的提高,其计算速度远远高于传统的SOM-SD算法。其次,提出了一种基于空间约束的分层模糊C均值算法,该算法是基于FCM-S(基于空间约束的模糊C均值算法)改进而来的。相比K均值,其避免了噪声对视觉词汇的影响,增加算法聚类的鲁棒性;相比FCM-S,其提高了算法的计算效率。在相同环境下的实验证明,该算法在图像分类的鲁棒性和计算效率方面都有了明显的提高。
其他文献
太阳光通过大气层时会与大气粒子间发生相互作用从而产生偏振光。天空中各种不同属性的偏振光叠加,便形成了包含大气信息参数在内的各种信息的偏振模式分布,这种偏振信息分布模
本文对数字水印技术进行了研究。数字水印是信息隐藏技术的一种,它在公开的图像、音频或其他媒体中嵌入不可见的图像、音频或信息,可应用于数字作品的版权保护等方面。  
在无线网络规划的整个过程中,站址规划是一项灵活且至关重要的问题,被认为是公认的NP-难问题。在满足覆盖率和系统容量的情况下,如何减少成本且提高利润是电信运营商追求的目
随着导弹、卫星、航天飞行器的出现,中等精度的跟踪雷达逐渐满足不了武器系统的跟踪测量要求,因而催生了20世纪50年代诞生的精密跟踪雷达。典型的精密跟踪测量雷达都采用单脉
无线通信业务随着用户对高速率数据业务越来越高的需求而飞速发展,频谱资源和能源作为不可再生资源受到越来越多的关注。正交频分多址(Orthogonal Freqency-Division Multipl
相位恢复是指仅利用傅立叶变换或者其它线性变换的幅值对原始图像进行重建,由于相位信息的缺失,该问题具有不适定性。在实际应用中,相位恢复问题会受到不同噪声干扰,因此在稀
蜂群算法是一种新型的元启发式仿生算法。算法中每个蜜蜂都可以看作一个智能体(agent),通过蜂群个体间协同作用达到群体智能的效果。蜂群算法主要是模仿蜜蜂采蜜与繁殖两种机
随着计算机技术的迅猛发展,嵌入式系统已成为计算机领域的一个重要组成部分。现在的嵌入式应用对嵌入式设备的性能提出了更高的要求,8/16位单片机所提供的系统性能很明显已经
学位
全光二维负反馈系统是用低精度光学器件实现高精度光学图像处理的重要工具,具有高速、并行的优点,与仿射线性变换结合可以实现真正的二维负反馈图像迭代函数系统(IFS),IFS是