基于字典学习的图像自动标注方法的研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:genersoft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术与移动互联网的快速发展,大量的图像信息每天以不同的方式产生并以数字的形式被上传到互联网上,这使得图像成为目前互联网时代中人们传递信息的重要手段。面对日益繁多的图像资源,如何方便快捷地组织和精准地检索目标图像显得迫在眉睫。图像自动标注是当前图像处理领域中的研究热点,其目的是为图像分配若干能描述其图像视觉内容的标签(关键词),它是当前以文本为基础的图像检索过程中一个关键性的步骤。图像自动标注在十多年的发展历程中,取得了丰硕的研究成果,不但其精度在持续提高,而且标注模型也在不断完善。但是由于低层视觉特征与高层语义之间存在语义鸿沟的制约,使得图像自动标注的标注性能和标注效率仍然有待提升。本文在学习探索现有标注方法的基础上,以提高图像自动标注性能和标注效率为出发点,结合机器学习中的稀疏编码技术和字典学习方法的高效性,提出基于Fisher字典学习的图像自动标注方法和基于判别字典学习的图像自动标注方法。具体工作内容如下:(1)首先简单介绍了图像自动标注的研究近况、当前研究中存在的难点与不足。然后介绍了与图像自动标注研究过程相关的基本理论知识。(2)针对数据集中标签分布的不平衡性、图像不同类型特征的有效组合后的纬度问题,提出了一种结合核空间映射的Fisher判别字典学习图像自动标注方法。本方法在高斯核函数的作用下将最初的输入数据映射到一个高维的核空间进行判别字典学习。实验结果表明,基于核空间Fisher判别字典学习的图像自动标注方法在改善图像标注性能方面具有一定的有效性和可行性。(3)为了降低语义鸿沟对图像自动标注的影响,提高标注效率,本文结合标签一致性判别字典的高效性提出一种多标签判别字典学习图像自动标注方法。该方法首先在字典学习的输入特征空间中,为每幅图像提取多种类型的特征,然后引入一个训练集标签相关正则化项,将样本之间的标签相关性作为字典学习的部分输入特征数据,最后以得到的判别字典和系数矩阵为基础设计相应的标签预测算法来实现未知图像的语义标注。最终实验数据表明,使用这种方法可以较好地效提升标注准确度和标注性能。
其他文献
日本、韩国的历史数据表明,经济高速增长时期,税收增速超GDP增长;经济由高速增长转为中速增长时期,经济增速与税收增速分别出现较大幅度下降,但经济增速下降幅度更大;经济转
提高学生的计算能力是数学教学中非常重要的一部分,计算能力的强弱,能够影响学生对数学的学习兴趣,进而影响数学的学习效果。在初中数学教学过程中,学生计算能力低的主要原因
视频图像序列在采集的过程中不可避免的会产生退化现象。例如,当视频采集设备的载体在拍摄的过程中发生了不规则的抖动,采集到的视频图像序列就会存在模糊、不稳定等现象。图
换向器主要应用于电机、起动机等设备中,是某些机械装置中不可或缺的部分。换向器的加工精度很大程度影响了这些装置的性能好坏,特别是在一些特殊的领域。换向器加工的第一到
与其他农村地区相比,流转了土地的村庄正在发生产值农企化、产品商品化、劳动力工人化、农民居民化的转型。与此同时,村庄的常住人口也异质化了。这在一定程度上弱化了原来建
招商引资是促进县域经济发展的重要战略,招商引资是推动地方经济发展的重要途径。以江苏邳州市为例,阐述了招商引资工作的重要性,结合当前县域招商引资的实际情况,对县域招商
随着网络应用普及和复杂程度增加,传播速度快、危害面广、自动化程度高的新型攻击手段层出不穷,网络安全威胁日益严重。传统的被动式防卫技术在攻击发生后实施单点防卫,安全
主题公园作为近年来发展迅速的旅游资源之一,是一种主题性文化与旅游业相结合的新型旅游和特色旅游。文章对主题公园营销的相关文献进行了整理,分析了主题公园的现状,总结了
计算能力是学生必须掌握的一种基础能力,而中职学生数学基础薄弱,基本都是数困生,遇到计算问题时,普遍存在很大困难。学生没有好的计算能力,既不利数学成绩的提高也给专业课
随着科学技术的发展,我国城市化进程也得到迅猛发展,城市空域的电磁环境更为复杂。通信信号在空间的传输机制包括直射、透射、反射、衍射,因此通信信号的衰耗包含直射损耗、