基于改进的K-means和层次聚类方法的词袋模型研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:sunrainnet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词袋(Bag of words,简称Bow)模型最早应用于文本文档的分类领域中,近年来,随着对词袋模型的进一步研究,以及模型本身具有简单有效的特点,使得模型得到了更加广泛的应用,并且在图像处理中也发挥着巨大的作用。由于图像在人们的生活工作中发挥着不可或缺的作用,因此如何在庞大的图像数据库中,快速准确地查找到人们所需要的图像信息是至关重要的。论文主要研究基于词袋模型的图像检索方法,针对传统词袋模型中存在的问题做出了相应的改进。论文的主要研究工作概括为以下三个方面:1.提出一种结合层次聚类和K-means聚类的混合聚类算法,自动确定数据集的最佳聚类数目。首先对数据集采用凝聚式层次聚类算法聚类,依据有效性评价指标和最大最小距离算法,自动确定最佳聚类数和初始聚类中心,然后使用K-means算法再聚类,得到最终的聚类结果。论文选取UCI数据集中的数据集作为实验对象,证明了算法的有效性。2.在传统词袋模型的基础上,构造了空间视觉词袋模型。通过对图像进行空间层次划分,引入图像的空间信息,从而构建空间视觉词袋模型用于之后的图像处理,再结合PCA算法和巴氏距离来度量图像之间的相似程度,进而完成对查询图像的检索过程。实验结果表明采用改进后的方法检索得到的图像结果更接近于用户的查询目的。3.引入了相关反馈技术,使得查询图像的初步检索结果更加接近用户的查询意图,提高了图像检索的精确度。依据用户对初步检索结果给出的反馈标记,采用基于特征权重调整的相关反馈技术作进一步研究,通过反馈循环,获得较为满意的查询结果。实验结果证明了相关反馈技术在图像检索中的有效性。
其他文献
近年来,随着人们对无线传感器网络(Wireless Sensor Network, WSN)理论研究的不断深入,其应用领域迅速的扩展到了我们生活中的各个方面。野外火灾的特点是破坏性强、蔓延速度快,采
VRML是一种虚拟现实建模语言,它的基本目标是建立因特网上的交互式三维多媒体,它以因特网作为应用平台,作为构筑虚拟现实应用的基本构架。它的出现及其发展改变了网络的二维
随着计算机技术的发展,数字图像处理技术已经成为视觉图像研究的主要手段。但是,迄今为止人类还未能构建出一种达到高等生物视觉性能标准的自主视觉系统。其中,有一个重要因素就
无线传感器网络是一种特殊的Ad-Hoc网络,它具有自组织、快速展开、抗毁坏性强等特点,在军事、环境监测、医疗健康、工业控制等方面有着十分广阔的应用前景。近年来,随着微电
企业为了在日趋激烈的市场竞争中立于不败之地,需要不断优化其生产、经营过程,因而对业务过程的高效组织和管理成为提高企业效益、增强企业竞争力的重要手段。工作流建模作为一
众所周知,UML是半形式化的。Petri网虽然是形式化的工具但本身又有不便于应用的缺点。所以论文的目的是把UML活动图模型转换为PNML,以便能够用Petri网分析工具来分析UML所描
说话人识别以其独特的方便性、经济性和准确性等优势在公安、司法、声控以及军事等领域有着广阔的应用前景。如何从大量的语音数据中提取反映说话人个性特征的语音参数和设计
随着移动通信技术的快速发展,人们对基于位置服务(Location Based Service, LBS)的定位精度要求越来越高。由于GPS,A-GPS等常用定位技术在城市环境中存在各种问题和不足,以及
指纹识别因为其悠久的历史以及较高的识别精确度,成为了目前最成熟的生物特征识别技术之一,并被广泛的应用到各个领域当中。在大型的指纹数据库中,待识别指纹与样本数据库中
与时间相关的数据库应用需求的不断增长,使得时态数据库设计成为非常重要的问题。在数据库的设计中,要充分考虑对数据依赖的处理,数据依赖是指数据之间存在的各种联系,数据冗