论文部分内容阅读
近年来,随着多媒体技术和因特网技术的飞速发展,数字图像资源急速膨胀。为了有效的管理和检索这些资源,图像检索技术应运而生,并成为图像领域的研究热点之一。现有图像检索技术存在的一个突出问题是图像低层特征与高层语义之间存在巨大的语义鸿沟。
感兴趣区检测技术是弥补语义鸿沟的一个主流技术。视觉注意模型是依据人眼视觉系统理论得到图像中最容易引起人们注意区域的方法,其显著性的大小一般用图像来表示。因此,研究视觉注意模型对图像的感兴趣区检测具有重要意义。
本文介绍了图像检索技术的发展现状以及面临的语义鸿沟问题;在总结视觉注意模型的研究进展和主要实现方法的基础上,根据人眼视觉系统理论,从用户是否携带观察任务两方面分别给出了基于视觉注意模型的感兴趣区检测方案。主要研究内容包括:
1.一种改进的进化规划的区域检测方法。对进化规划方法进行了改进,增加了阈值处理、区域增长等,以得到符合实际目标的候选区域。
2.改进的Itti视觉注意模型。运用符合人眼视觉特性的小波进行多尺度变换,用中央周边差计算局部显著度,用进化规划方法计算全局显著度,融合得到视觉显著度;根据视觉影响因子对视觉显著度进行修正,并且由显著点与候选区域合并得到感兴趣区,最终实现了一种用Bottom-Up视觉注意模型检测感兴趣区的方法。
3.实现了一种Top-Down视觉注意模型。通过相似性距离调整颜色、亮度、方向等特征的权重得到视觉任务的显著特征,经过面积增强因子修正Bottom-Up视觉注意模型检测的感兴趣区。
4.实现了一个检测感兴趣区的软件平台。
实验结果表明,本文提出的基于视觉注意模型的感兴趣区检测方法获得了较为满意的区域检测和兴趣度量结果,检测的感兴趣区符合人眼的视觉注意机制。