图像检索中相关反馈的半监督主动学习研究

来源 :大连海事大学 | 被引量 : 1次 | 上传用户:benxiaohai10000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体与互联网技术迅猛发展,基于内容的图像检索受到广泛关注。然而早期的基于内容图像检索仅仅利用图像的颜色、纹理、形状等特征信息进行图像间相似性判定而无法有效解决图像低层特征与其高层概念语义不一致的“语义鸿沟”问题。相关反馈技术的引入有效缩小了语义鸿沟。统计学习与机器学习在相关反馈中的应用改善了图像检索的性能。本文针对学习过程中存在的小样本问题与数据冗余问题,从动态距离度量和聚类方法两个角度探索了融合谱聚类的半监督主动学习方法。具体研究内容如下:(1)本文采用一种动态距离度量方式对图像间相似性进行度量。根据反馈过程后用户反馈的相关性信息,针对不同低层特征动态地调整动态距离度量公式中相对应的权值,以反映用户的“主观性”,凸显“有利”特征,提高聚类准确性。(2)在动态距离度量的基础上,采用Ncut谱聚类方法对反馈区中样本(富有信息样本)进行聚类,选取待标集,以处理主动学习过程中的数据冗余性问题,从而使分类器从对同语义类中冗余性样本学习转变为对不同语义类样本学习,增强了分类器的主动学习效果。(3)本文针对SVM-AL,SSAIR, RS-AS3VM-AL三种不同学习策略的算法,融合谱聚类方法,总结出了SVM-AL-DC,SSAIR-DC, RS-AS3VM-AL-DC算法。(4)本文设计并实现了一套CBIR检索系统并进行相关实验。该系统具有较好的灵活性。通过实验分析与比较,验证了半监督主动学习方法在检索准确性方面的优势,而谱聚类方法的融入,对检索准确性的进一步提升具有积极意义。
其他文献
网络、3G技术的发展促进了视频通信领域中具有较高压缩效率、更好的网络健壮性的视频压缩标准的应用和研究。但视频压缩编码的计算密集性和数据密集性依然是H.264/AVC等标准
医学图像三维可视化是一种将传统的计算机图形学的相关知识运用到医学领域中,在计算机上对医疗设备获取的二维断层图像,通过图形学技术的处理和转化,根据视觉原理显示为直观
自从曼德尔布罗特(Mandelbort)引入分形概念以来,分形作为一门新兴的非线性学科,受到了学术界的广泛重视。分形理论主要描述自然界与非线性系统中不规则的、具有自相似结构特
在当前信息技术高速发展的后PC时代,嵌入式系统已经广泛地渗透到人们的日常生活等方方面面中。IT技术大融合及“三网融合”加速了嵌入式系统产业化进程。随着家用电器向数字
作为一种生物认证识别技术,说话人识别技术具有远程控制的独特优势,在互联网发展日新月异的今天拥有非常广泛的应用前景。近年来出现的说话人识别主流方法如GMM-SVM, JFA 和
随着网络规模的日益扩大,网络上经常会出现偏离正常网络行为的异常流量。这些异常流量不仅会造成网络性能下降,更严重的会造成网络瘫痪。因此,如何在大规模网络环境下进行网
面向主题是数据仓库的特征之一,面向主题是指数据仓库中的数据是按照主题进行组织的,合理地选取主题是数据仓库设计成功的前提条件。没有正确、合理的主题,就无法合理地组织
无论何时,人们都希望在第一时间得到问题的答案。为此,自动问答一直是人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。随着硬件的强有力支持,以及
伴随着互联网的高速发展,视频数据高效、实时的传输,需要按照一定的视频压缩标准进行编码。运动估计作为视频编码过程中的核心步骤之一,其优劣程度直接关系到视频压缩编码的效率
在计算机图形学领域里,自然景物的模拟是一个重要的研究课题,它在虚拟现实,计算机游戏、影视、广告、视景仿真等领域中有着广泛的应用。在自然景物的模拟中,水的模拟是比较重