基于词袋模型的视觉词典构建

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:zhanbusha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展及广泛应用,数字图像大量地出现在人们的生活中。面对海量的图像资源,如何准确、高效地实现图像的分类、检索、标注等各项工作,已经成为当前智能信息处理研究的热点。词袋模型是分类算法中应用比较广泛中的一种,并在图像分类中表现出优良的性能,所以获得了广泛的研究与应用。视觉词典是词袋模型的基础,构建更具有描述性的视觉词典不仅能提高图像的分类准确度,还能减少算法计算时间。如何获得更具有代表性的视觉词典,以便更好地对图像进行描述已经成为提高分类准确度一个关键的步骤。本文以构建具有较高辨识度的视觉词典为目标,研究视觉词典的优化方法,将优化的视觉词典应用到图像分类中,以提高图像分类的准确度。围绕上述内容,本文研究内容主要体现在如下两个方面:第一,在传统词袋模型和现有香农熵的基础上,首先对两者存在的问题进行分析;然后针对存在的问题对其进行改进,以便筛选出辨识度高的视觉词典。首先将训练集按类别聚类;然后利用改进的香农熵计算每个类中每个视觉单词的香农熵值,删除香农熵值大的视觉单词,也就是每个类中辨识度低的视觉单词;最后将优化后的每个类的视觉词典放到一起得到优化后的词典。实验结果表明,新方法可以选择出更具有代表性的单词,提高分类结果。第二,分析了传统互信息进行单词选择过程中存在的问题,对传统的互信息进行了改进,并将其应用到视觉单词选择中,筛选出辨识度高的视觉单词。该方法对互信息进行单词选择的影响因素和不足进行了综合分析,更有利于选取就有代表性的视觉单词。本文针对传统词袋模型视觉词典构建中存在的问题,在已有的香农熵和互信息的基础上对其分别进行改进,将改进后的香农熵和互信息应用到单词选择中,筛选辨识度高的视觉单词。本文将构建的富有判别力的视觉词典应用到图像分类中,提高了图像分类的分类准确度,并且可改善计算速度。
其他文献
实现大型风力发电机组的状态监测与控制是确保大型风力发电场安全、有效运行的手段。文章论述了大型风力发电机组的状态监测、控制技术参数与特点,分析、设计了大型风力发电机
(2000~2009)中国网络传播特性1995年,在这个全球互联网商业的发韧之年,好莱坞一部叫作《未来水世界》的科幻片为我们描述了人类未来的生活图景:公元2500年,由于地球两极冰层融
针对奥氏体不锈钢管在出厂前可能存在的横、纵裂纹对在役过程中的安全使用存在的巨大威胁,提出了一种基于地磁场环境下的磁法检测技术。通过对试验样管的内外壁制作人工刻槽,
我科从1995年以来,运用直流电药物离子导人、中频电疗、超短波疗法、颈椎牵引等综合理疗的方法,治疗椎动脉型颈椎病487例,报道如下:
运用传播学中的受众理论,结合周至县二曲镇渭旗村农民对主流意识形态认同的实证调查,分析主流意识形态传播过程中农民这一受众的思想特点、心理需求,深入探讨农民对主流意识形态
“蒜你狠”、“豆你玩”、“姜你军”、“药你死”等当下网络流行语,有其变异的词汇、语义、语音及偏离常规的语言修辞,并折射出残酷的市场竞争机制和社会涨价现实,也体现了一种
根据武夷新区的区位及城市布局结构,从生态学的角度探讨了滨水景观规划设计的原则,并对武夷新区滨水景观进行了初步规划。
对国内四大绝缘漆生产厂家提供的6种F级绝缘漆漆样进行选型试验,通过对试验数据以及样机湿热试验结果的分析评定,最终选出较为理想的适用于低压散嵌电机浸渍的F级绝缘漆。
为实现转炉溅渣护炉阶段的气化脱磷工艺,避免炉渣磷富集,便于脱磷熔渣留至后续炉次循环利用,在实验室进行了焦粉还原转炉渣的热态试验,研究结果表明,随着试验温度的升高,焦粉
本文从抚远人才的实际情况,充分分析、肯定了在实施“人才强县”战略中,抚远县委组织部的人才之家的“孵化器”作用,在发现人才、凝聚人才、造就人才、用好人才上积极探索创