基于主题嵌入词袋模型及标签词频分解的图像标注研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:geniuscaobo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网的发展和社交网络的成熟,图像信息以前所未有的规模进行传播。自动图像标注是目前实现高效地管理和检索海量图像数据的重要技术之一。本文研究自动图像标注方法中词袋模型主题语义表达、数据集标签完善和标注中的视觉近邻与语义近邻的问题。主要工作如下:1、针对词袋模型视觉单词表不表征图像主题,造成语义丢失的不足,构造了一个新的主题嵌入视觉单词表。以图像主题作为伴随信息,将纹理元特征以主题-子主题-分层特征树的方式组织,从而在词袋模型的直方图中通过语义聚集嵌入了主题信息。其中对训练集主题交错和未标主题的情况,利用标签词频分解向量法对训练集进行主题伴随信息生成。实验表明在主题模型的图像标注算法上,所提出的主题嵌入词袋模型比PLSA-Words算法原文中的词袋模型平均查准率提高9.8%,平均查全率高7.9%,调和平均数高9.2%。主题嵌入词袋模型不仅能够表达出图像的纹理元特征,而且含有图像的主题信息,有效改善了词袋模型表示图像特征和语义有效性。2、FastTag标注算法的标签补全模块使用的是布尔型特征代表标签的“有/无”,并未考虑同一图像标签之间的语义重叠程度,标签语义相关特性也并非二值变量。本文提出了基于词频分解向量的改进FastTag标注算法,用标签词频分解向量的取值连续化方法代表标签,使标签语义之间的重叠比例合理的量化,提出新的联合损失函数寻优方法,用于训练标签补全分类器和标签预测分类器。实验表明改进的FastTag算法比FastTag算法平均查准率高1%,标注出标签种类个数提升了1个,在训练集图像标签个数少的情况下标注结果要好。表明改进的FastTag算法能够对图像标签进行有效地扩充。3、针对FastTag标注算法对部分图像标注准确率低的问题,提出了结合标签与特征的图像最近邻选取的图像标注。鉴于视觉特征选择的近邻图像不一定为语义近邻,提出了结合特征与标签的双模态图像最近邻选择方法。标签词频分解向量作为图像文本模态加入近邻图像查询,使最近邻图像集含有相似的标签。利用每一幅图像的近邻图像集作为FastTag算法的训练集,量身定做FastTag算法,提高每一幅图像的标注效果,从而提高总体的标注效果。实验表明在图像近邻下的FastTag算法比FastTag算法的平均查准率高2.7%,平均查全率高1%,调和平均数高1.8%。表明双模态的图像近邻选择的图像语义上更加相似且图像近邻下的FastTag算法提升标注准确率低的图像的标注效果。
其他文献
采用Fenton高级氧化技术对含盐量TDS≥3×10^5 mg/L、COD≥1×10^4 mg/L、色度大于2 500倍的污水进行处理,以达到去除COD和色度,消除水体异味的目的。研究结果表明:Fe
目的分析强制性运动疗法应用于脑卒中偏瘫康复治疗的效果分析。方法取2017年4月-2018年5月信阳市中心医院收治的脑卒中偏瘫患者76例作为研究对象,按随机数表法分为参照组(38
在语文学科的学习中阅读占比较大,因为任何语文课文的学习都是在阅读的基础上进行理解,做好阅读教学是提高学生语文素养和基础的重要手段。本文在新课改的背景下,按照小学语
近年来,在倡导阅读素养的背景下,阅读教学的研究又进入了人们的视野。美国在阅读教学方面有着比较成熟的教育理念与教育方法,借鉴和学习美国经验,对于推动我国的阅读教学发展
何先生平常有高血压和糖尿病,因为没有严格按医生要求吃药,某天突然出现了右半身偏瘫、口舌歪斜、讲话不清等症状,家人立即将其送往医院,医生诊断为何先生这是中风了。中风也
报纸
火棘,是蔷薇科火棘属(火把果属)Pyracahtha Roem植物的通称;民间习称火把果或红津果,救荒粮或救命粮,救兵粮或救军粮。在湖北省分布广泛,资源丰富。然而迄今无人问津,自生自
党的十七大明确提出,加快转变国有经济发展模式,推动产业结构优化升级,是关系国民经济全局的紧迫而重大的战略任务。在我国以公有制为主体,多种所有制经济共同发展的基本经济
骨钙素是成骨细胞合成和分泌的基质蛋白,参与骨吸收调节、成骨细胞分化和基质的矿化,是骨转化的特定生物标志物。研究发现骨钙素调节血管内皮舒张因子的产生、炎症因子的作用
京津冀地区是国家的重点发展区域,尤其是"京津冀协同发展"上升为国家战略之后,京津冀地区的规划和建设成为研究热点。文章以区域新型城镇化作为研究对象,将GIS技术与定量分析
横波在穿越裂隙介质时会分裂成平行裂隙的快横波和垂直裂隙的慢横波,其偏振角随着波传播的时间和空间而变化.利用角度谱可以有效地求取偏振角,从而分离快慢横波.这里介绍了角