图像检索中缩小语义差距的几个关键技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：xliang677

【摘要】

：

图像检索涉及到的研究范围比较广。本文仅对图像检索中所涉及到的图像分割、图像的自动语义标注以及标注图像的语义分类等几个关键性问题，进行了深入和系统的研究，提出了一些新

【作者】

：

于林森

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2006年期

【关键词】

：

图像检索迭代算法自动语义标注语义分类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像检索涉及到的研究范围比较广。本文仅对图像检索中所涉及到的图像分割、图像的自动语义标注以及标注图像的语义分类等几个关键性问题，进行了深入和系统的研究，提出了一些新的思想和方法。　　在众多的图像分割方法中，基于特征空间聚类的混合模型方法常常能获得稳定的分割结果，而且 EM算法为模型参数提供了有效的极大似然解。然而混合模型方法是以像素的独立性假设为前提，没有考虑邻近像素间的类别相关性。而且 EM算法的贪心本质使其对初始值的选择具有很强的依赖性。另外，估计混合分量的个数仍是一个尚未解决的问题。为此本文在混合模型的参数求解过程中，利用空间域滤波方法对EM算法中的E步骤进行了限制，以使模型参数的求解受到像素位置关系的约束。这样，分割结果不仅依赖于像素的统计特性，还兼顾了它的空间位置信息。在混合模型中引入这种位置约束方法，在一定程度上减小了算法陷入局部极值的可能性。而且，滤波的平滑能力降低了分割区域的空间混杂现象，使图像过分割区域所对应的混合分量趋于重合，这为模型选择提供了一种新的实现途径。本文给出的算法从事先给定的混合分量个数开始迭代，通过合并具有相似参数的混合分量，算法可以自动地进行混合分量个数的选择。整个算法只需一个迭代过程，实现了参数估值和模型选择的无缝结合。　　由于 EM算法是一类迭代算法，而且算法每次迭代需要访问所有的数据点，这无疑限制了图像的分割速度。以滤波方法在混合模型中增加对像素位置关系的约束，并没有在模型中引入与像素位置相关的参数，因此，可以采用图像减采样方法降低模型参数学习所需访问的数据量。本文把图像划分为由局部像素构成的若干子块，将每个子块视为低分辨率下的一个像素，其特征值为原始分辨率子块内所有像素特征值的一个统计量，缩小了每个图像区域内的视觉差异性，同时也凸显了不同图像区域间的差异性。为了提高小样本数据的统计可靠性，对参加模型求解的像素块采取加权处理方式，并利用滤波前后像素后验概率间的差异来调整像素权值，自适应地加强小样本数据的统计特性。　　对于图像的自动语义标注，本文并没有考虑建立一个通用的统计模型，来模拟图像区域和标注字之间的复杂相关性，而是将视觉特征和标注字信息分别看作对图像进行描述的两种不同语言，并采用基于实例的机器翻译方法对图像进行标注。将基于实例的机器翻译思想应用于自动图像标注中，把带有标注的训练样本集当作一种标注经验，在给出了一幅图像的视觉描述后，从经验库中检索出与之视觉相似的图像，并且通过模仿这些例子图像的标注，对图像实施标注。对于图像的视觉特征，采取了基于区域的描述方式，并采用推土机距离作为图像间视觉相似性的判别依据。为了增加检索出的示例图像的可靠性，对推土机距离作了改进，增加了图像视觉间匹配的自适应性。与基准统计标注模型标注性能的比较，证实了算法的有效性。　　图像的标注为语义分类提供了有效的判别依据，但由于每幅图像只能获得有限的标注字，以及标注字固有的语义不确定性，为标注信息的合理运用增添了难度。本文通过判别标注字与视觉特征之间的相关性，降低标注字的语义模糊性，因此可将每个标注字视为一个单纯的语义聚类，并通过单标注字类别的合并，获得最终的语义类别。由于语义一致的图像并不一定具有视觉相似性，而利用视觉与标注字之间的相关性，能将视觉连贯性较差的图像过滤出来，这样可以利用视觉连贯性较好的图像，进行语义类别提取和归类。而对视觉连贯性较差的图像，则利用已经生成的语义类别，采用标注字信息对其归类。这种做法能够较好地保证聚类结果的语义一致性，而聚类的数目可以由所提取出的语义类别数确定，解决了非监督学习中的聚类数目选择的问题。采用外部聚类有效性判别准则验证了对标注图像进行自动编目工作的可行性。　　最后，总结了全文工作，并进一步对本课题今后的研究工作进行了展望与设想。

其他文献

数据挖掘在ERP集团解决方案中的研究与应用

企业的集团化带来组织形式、经营方式、管理模式的巨大变化,使企业面临更多的管理问题及经营风险。新的挑战对企业提出了新的要求,拥有科学的管理思想和先进的信息管理手段的

学位

ERP数据仓库OLAP数据挖掘

基于时钟精度差和小波分析的时钟同步

时钟同步问题是分布式操作系统中的一个经典的问题，是分布式计算中的核心技术之一。随着计算机技术和网络通信技术的迅猛发展，这个问题又被赋予了新的内涵。本研究的目的就是在

学位

分布式系统时钟同步时钟精度差时钟同步状态图小波分析

层流冷却过程控制模型参数智能优化策略及应用研究

卷取温度对带钢的金相组织影响很大，是决定成品带钢加工性能、力学性能、物理性能的重要工艺参数之一。层流冷却过程具有强非线性、不确定性、时变的特点，采用传统的基于传热机

学位

带钢轧制层流冷却工艺卷取温度预测控制神经网络线性回归

虚拟植物生长中树木的快速绘制

目前对包括树木在内的计算机虚拟植物形态绘制的方法中主要有分形和粒子系统等，与分形比较其他方法对树木的绘制在外界影响下动态变换效果不够理想，真实感比较差。本文根据

学位

树木自相似迭代函数系统碰撞检测真实感

基于Ad hoc网络的运动一致性模型研究

Ad hoc网络是由一组通过无线链路连接的移动路由终端组成的自治系统，移动终端具有路由功能，可以通过无线连接构成任意的网络拓扑，这种网络可以独立工作，也可以与Internet或更大规

学位

Ad hoc网络运动一致性模型无线链路连接平面路由协议LANMAR协议GPS技术

继电控制系统仿真技术研究

继电控制系统是最早采用的控制系统之一,其控制动作可靠、控制装置比较简单,在各种场合中得到了广泛应用。在继电控制系统的设计、运行和维护等各阶段,都需要对其进行功能分

学位

仿真CAD继电控制系统开关网络开关函数“批”概念

基于P2P技术的网络共享平台模型研究

随着Internet技术的迅速发展，网络规模的逐渐扩大，网络资源的日益丰富，使得网络用户之间的资源共享和信息交流越来越普遍，网络文件共享系统成为网络资源方便共享的重要途径。为了

学位

对等网网络共享平台资源定位路由策略

基于数据仓库的电信企业EIS的研究与实现

随着电信企业业务运营支撑系统的建设逐渐完善，电信企业的经营分析系统建设已经成为近年来各电信企业的信息化建设重点。基于数据仓库的经营分析系统能够为电信企业的分析与决

学位

EIS数据仓库KPI软信息

Web Services性能及安全性能研究

随着WebServices技术的逐渐普及，企业或组织有必要更多的了解其特征和性能。为了保持WebServices的开放性以及支持多客户类型，安全性问题应最先考虑。用户需要去了解怎样保护We

学位

Web Services技术安全性能性能评测

基于移动IPv6越区切换的研究

移动互联网是下一代网络发展的趋势之一，移动IPv6 是移动互联网的基石。目前，移动设备越来越多，这些设备也迫切地希望能在任何地点、以任意的接入方式(有线或无线)、用固定

学位

移动IPv6移动互联网TCP协议丢包率移动节点

图像检索中缩小语义差距的几个关键技术研究

其他学术论文