论文部分内容阅读
图像挖掘是应用数据挖掘技术实现图像理解的多学科交叉研究课题,它融合了数据挖掘、图像处理、计算机视觉、图像检索、机器学习、模式识别、数据库与人工智能等研究领域。图像挖掘的核心任务是从图像底层特征中,高效的获取高层图像空间对象及其关系,提取出图像序列中隐含的、先前未知的、潜在有用的知识、图像关系或其它隐含的图像模式。本文针对图像的“语义鸿沟”问题,提出了图像语义挖掘框架,分别研究了图像语义层式统计模型、图像语义对象获取、图像语义相似测度等内容。并将以上研究成果应用于图像检索,设计了XML驱动的图像语义检索系统原型。本课题是国家973项目“语义网格的基础理论、模型与方法研究”子项目“基于Agent的网格化服务组织与管理”的研究内容之一,是该框架下“语义驱动的应用服务”在图像挖掘与检索服务中的研究案例。 本论文的主要研究结果与创新点包括: 1.探讨了用于缩小图像“语义鸿沟”的语义层式统计模型 根据图像内容不同的语义粒度,定义了四个层次的内容描述机制:图像子块层、元语义层、高级语义层和语义类别层。采用有限混合模型(FMMs)建立各语义层次之间的统计映射关系,利用优化的EM算法自动返回FMMs的最优模型结构,实现模型参数估计。层式语义分类实验证明,该模型具有良好的图像内容描述性能,能有效的缩小图像内容的“语义鸿沟”。 2.设计了具有良好训练性能的优化算法HAB 通过定义更为周全的评估函数,获取最优化的权重更新值,使每一次迭代训练都集中在最需要学习的样本上,提高了训练的效率,降低了训练误差;同时通过对已经被正确分类的训练样本的性能评估,控制其权重在一个合理的范围之内,避免了过拟合现象的出现,提高了训练的鲁棒性能。通过与AdaBoost的比较性实验,HAB算法在训练误差与抗干扰能力方面具有更好的性能。 3.给出了应用HAB算法的图像语义对象获取方法,提高了图像语义对象的识别性能。 引入“特征致密区”与“特征稀疏区”的概念,通过图像子块采样的方式描述训练图像的底层特征。对训练图像特征进行“两级处理”,获取用于训练的“特征池”。利用HAB算法所具有的良好训练效果,迭代训练特定语义对象的识别器。通过实验,训练之后的识别器具有良好的语义对象获取性能,识别精确度和返回率有了很大的提高。 4.研究了基于语义相似测度的图像语义类别统计描述 将图像特征分为“核心特征集”与“辅助特征集”,基于以核心特征为主,