论文部分内容阅读
随着互联网的发展,多媒体图像数据海量增长,互联网已经进入了一个大数据的时代。基于关键字的检索方法由于效率较低,检索速度较慢,已经无法满足对海量图像数据进行检索的需求。为了提高图像检索的效率以及准确率,图像检索已经逐渐由关键字检索转向图像的语义检索。本论文针对飞速发展的多媒体市场,和人们在海量数据环境下对图像进行检索的需求,从解决语义鸿沟问题的角度展开学习和研究。本论文研究符合互联网大数据环境下的,多媒体业务的图像检索中语义内容的分析和分类算法。其中,主要的研究内容包括以下三个部分:1)在图像特征提取环节中,本文提出了一种基于分层结构的图像特征融合机制。该机制通过对低层全局特征进行融合,使得系统不会过滤掉相关图像。同时该机制建立了一种自适应的特征融合算法,能够自动的选取较为重要的特征,从而在提高效率的同时,也提高了系统的准确率。经过实验验证,该算法具有较好的鲁棒性;2)在图像语义分析中,本文提出的基于信息熵的视觉词典重构算法主要针对K-means算法在聚类时可能产生的同义性和歧义性的问题。利用信息熵的方法,重新对视觉词典中的视觉词汇的信息量进行评估。并利用评估后每个视觉词汇的信息量对视觉词典进行重构。对于信息量大于阈值的视觉词汇进行拆分,对于信息量小于阈值的视觉词汇进行合并。该算法经过仿真实验验证,能够较好的改进K-means算法的统一性和歧义性问题,并且鲁棒性较好。3)在图像语义检索的相关反馈研究中,本文研究了一种有偏差的相关反馈算法,并利用粒子群优化算法(PSO:Particle Swarm Optimization)求得极值,得到最优权重系数。在利用PSO求极值的过程中,为了防止粒子群算法陷入局部最优的情况,本文对算法进行了4)改进,在速度计算式中加入抖动项,通过仿真实验验证,该改进能够很好的改善陷入局部最优的情况,使得粒子群算法能够很好的应用于相关反馈当中。经过仿真实验对比,我们发现本文所提出的算法与经典算法相比稳定性更好、相关反馈精度也更高。