基于弱监督学习的Web图像情感识别方法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:fossi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人们的日常生活中,情感起到非常重要的作用:丰富的情感对说话人传达思想有着极大的帮助。同时,图像情感识别是人机交互的重要研究领域之一。近年来,针对大规模图像情感识别的很多工作,推动了图像情感识别方法及系统的快速发展。但是,因为情感存在一定的主观性,所以标注大规模的图像情感数据集会花费大量的人力和物力。相反地,互联网(Web)中存在大量的情感图像:根据图像情感关键词(例如,高兴、悲伤等)能够获得大规模带有嘈杂标签的情感图像。然而,如果直接使用这些带有嘈杂标签的Web情感图像数据集训练情感识别模型,会给识别模型带来负面影响。因此,如何直接通过带嘈杂标签的图像样本得到鲁棒的情感识别效果是Web图像情感识别领域的关键问题。此外,众多研究发现:图像的局部区域对情感识别有显著影响,但标注图像中的局部情感区域也会费时费力。在图像情感区域定位中,与传统目标检测不同的是:不仅仅图像中的对象会引发情感,而且图像中的背景也会引发情感。所以,在图像情感区域定位中,如何定位情感对象及背景区域也是Web图像情感识别领域亟待解决的问题。针对上述两个Web图像情感识别问题,分别提出一种基于注意力的嘈杂标签Web图像情感识别方法和一种基于弱监督的Web图像情感区域定位及情感识别方法。其中,所提出的情感区域定位方法为情感识别提供辅助作用,提高情感识别的效果。论文的主要内容和创新点如下:(1)提出基于注意力的嘈杂标签Web图像情感识别方法:针对图像情感数据集标注困难问题,提出一种新颖的注意力机制方法,抑制嘈杂标签对情感分类带来的负面影响,从而直接利用Web图像实现情感分类;同时引入特定情感类激活图,为每类情感学到特定的情感显著特征;最后引入三元组损失及中心损失,扩大不同情感类别之间的距离,缩小相同情感之间的距离,提高图像情感识别的鲁棒性。实验结果验证所提方法的有效性:数据集嘈杂程度达到25%时,仍保持鲁棒的情感识别准确率(数据集Flickr,80.73%;Instagram,77.05%);在数据集嘈杂程度达到50%时,在数据集Flickr和数据集Instagram上情感识别准确率均高于其他注意力机制约20%;在公开的情感数据集TwitterⅡ、EmotionROI、Flickr、Instagram上,情感识别的准确率也高于现有最佳方法约2%-3%。(2)提出基于弱监督的Web情感区域定位及情感识别方法:针对图像情感区域定位的问题,提出多核的区域生成网络,产生大量情感候选区域,并且通过多核的结构,使得候选区域同时包含图像情感对象及背景;其次,提出端到端的多示例学习损失,将从一类情感样本产生的候选区域组成正包,其他情感类别样本产生的候选区域组成负包,通过迭代学习得到最终的图像情感区域;最后,将获得的情感区域作为图像的局部信息,通过特征融合的方式,结合图像的全局信息,提高图像情感识别的准确率。实验结果验证所提方法的有效性:情感识别任务中,在公开数据集TwitterⅡ、EmotionROI、Flickr、FI上获得与现有最佳方法相当的情感识别准确率结果;情感区域定位任务中,在评价指标F1-Score及Recall上获得比现有最佳方法更好的结果;同时,通过情感区域定位辅助情感识别,情感识别的准确率比原情感识别任务提高约11%-13%。(3)设计并实现基于弱监督学习的Web图像情感识别原型系统:采用Matlab设计原型系统的操作界面,利用Tensorflow与Keras等Python语言框架实现系统的核心算法。原型系统包含四个模块:数据预处理模块、图像情感识别模块、情感区域定位模块及结果可视化模块。通过原型系统的实现,验证了本文所提方法的可行性和有效性。
其他文献
随着城市化进程的不断推进,越来越多的城市开始大规模开发城市地下空间、地铁及地下综合管廊等典型城市地下基础设施建设与运营,盾构法隧道施工是地铁隧道与综合管廊建设的主要施工技术之一,管片拼装是盾构法工序的重要一步。作为盾构隧道主要支护结构的管片衬砌,管片错台、破损与开裂等管片拼装质量问题未及时解决可能出现隧道防水隐患。根据《盾构法隧道施工与验收规范GB:50446-2017》第9.3.5条,衬砌环椭圆
随着移动互联网和物联网的迅速发展,未来5G移动通信将面临更加复杂的接入场景:能够容纳大规模的连接设备,并支持更加多样化的用户服务需求。这给接入协议设计提出了很大的挑
河流水化学特征反映了水体化学组分的来源以及迁移转化规律,在一定程度上也反映出流域内发生的化学风化及与沉积物和岸边土壤化学组分的关系。分析流域水化学特征及其影响因素,探讨离子主要来源,可以为流域水土资源的可持续开发利用、生态环境保护与建设提供依据。本研究以黄河中下游干流(风陵渡断面至东营断面)为研究区域,分别于丰水期(2017年6月和2018年9月)和枯水期(2017年12月和2018年4月)采集了
近年来,随着互联网技术的飞速发展,许多音乐平台都为用户提供了在线数字音乐服务,方便用户收听音乐。数字音乐因此快速发展起来,人们从音乐短缺的时代走向了音乐过载的时代。
盾构隧道壁后注浆效果的好坏直接影响其周围地层沉降及隧道结构的稳定。目前尚无可靠的注浆体缺陷检测技术与设备,研究壁后注浆检测技术及方法对提高注浆体病害辨识度具有重要的现实意义。本文在探地雷达检测原理的基础上,重点研究了探地雷达在盾构隧道壁后注浆检测中应用的信号处理与信息获取等关键技术问题。论文首先给出了数据合并、废道剔除、去饱和截断、数字滤波等6种常用的雷达信号预处理方法在注浆体雷达实际检测图像上的
第一部分 中西医结合治疗多囊卵巢综合征的应用现状调查目的:多囊卵巢综合征(Polycystic ovary syndrome,PCOS)是育龄期妇女最常见的妇科内分泌疾病,主要表现为生殖内分泌功
脉冲等离子体推力器(PPT)具有比冲高、结构简单、控制方便灵活、能在低功率下稳定工作等特点,可以满足小卫星,尤其是质量小于100kg的小卫星对系统提出的低功耗和低质量等严苛要求,在卫星微小型化的发展趋势下,有着良好的应用前景。但过低的推力效率(通常<10%)一直为使用者所诟病,阻碍PPT的应用。过去50多年,PPT的研究者们为了提高PPT的推力效率,做了很多努力,但是收效甚微。故本文对脉冲等
作为未来移动通信发展的两大主要驱动力,移动互联网和物联网(Internet of Thing,Io T)在为第五代移动通信(Fifth Generation,5G)提供更加广阔应用前景的同时,也由于终端设备
为了应对大气湍流对光波前的不利干扰并提高自由空间光通信的可用性,我们重点研究了湍流波前的特性和波前模拟-校准的方法。本文设计了一个大气湍流环境下的光学模拟系统,围
水生植物是天然河流生态系统的重要组成部分。植被群落为水中生物提供食物来源和栖居场所,使得水体成为具有生命活力的水生生态环境,从而保存了水生环境的生物多样性。水生植