论文部分内容阅读
随着网络技术的飞速发展,网络上的信息呈现爆炸式增长,网络中的不良信息对人们尤其是未成年人的生活产生了极大的不良影响。不良图像识别对于保护青少年身心健康有重要的意义。互联网上的不良图像由于背景、光照、尺度、人体姿态的不确定性,识别难度非常大。传统基于兴趣区域的方法通过检测人体皮肤区域,并在皮肤区域附近提取特征,然而皮肤区域检测本身比较困难,此外部分不良图像并不包含大面积的皮肤裸露。基于图像全局特征的方法直接在图像上采集局部特征,并连接得到图像特征表示,这种方法由于难以覆盖图像中的不良内容,而且忽略了不良内容的空间关系,性能有限。基于人体部件的方法则通过检测人体语义部件,得到图像语义特征,这类方法由于忽略人体部件上下文信息,而且需要在原始图像上进行密集的扫描,非常容易发生误检。本文研究总结了已有方法存在的不足,提出了基于不良内容区域的深度加权多示例学习方法。本文主要工作如下:首先,本文方法将每张图像视作一个由多个图像区域组成的包,每个图像区域对包有不同的贡献度。其次,基于少量人体隐私部件的标注,本文方法可以生成大量具有不同贡献度的图像区域。同时,本文提出一种区域贡献度的度量方法,根据区域中包含隐私部件的比例计算得到每个图像区域的贡献度。最后,本文引入包概率函数用来结合不同贡献度的示例,并在深度卷积神经网络框架下将该方法形式化,训练得到识别模型。为了验证本文算法的有效性,本文从互联网上收集了一个大规模数据集,并在包含10万张不良图像和10万张正常图像的测试集上测试了各算法的性能。本文的深度加权多示例学习算法取得了最好的性能,在1%的假正例率条件下取得了97.52%的真正例率。