基于内容的成人图像检测算法研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:Silly728
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的飞速发展,为人们的生活带来了极大的便利,并逐渐成为人们获取信息的主要来源。但同时,在互联网上海量的图像中,存在大量的成人图像。这些色情内容极大地影响了儿童和青少年的身心健康。检测并过滤互联网上的成人图像,为青少年儿童提供一个健康的网络环境,已经成为国内外研究者日益关注的研究课题。近年来,很多研究者开始采取图像内容分析手段来识别成人图像,并且已经形成了一套主流的算法框架,即先对图像进行肤色分割,然后提取图像肤色区域的特征,最后采用机器学习策略,进行分类判别。已有方法往往误检率高,对肤色分割的精度依赖性强,并且识别速度慢。   本文针对现有算法的存在的一些问题,即存在大量误检、高度依赖于肤色检测的精度、较慢的处理速度,展开深入的研究。研究内容主要包括两个方面:肤色分割和成人图像检测。本文基于充分的文献调研,提出了一种新颖的肤色模型。在成人图像检测方面,本文着力于研究基于图像内容的检测技术,对已有的较为成熟并且可靠的算法框架进行有针对性的改进,提出了高效的检测算法。本文做出了如下主要贡献:   (1)传统的像素级的肤色分割模型,往往侧重于利用图像像素本身的信息,而忽略了相邻像素所提供的信息。在彩色图像中,属于同一区域的相邻像素通常具有很高的相似性。本文从这个角度出发,利用相邻像素之间的相似性来进行肤色分割,提出一种新颖的在线学习肤色模型。分割方法在训练阶段对相邻肤色像素间的颜色相似性进行建模,在分割阶段首先确定种子肤色像素,然后应用学习得到的模型进一步分割出图像中的其他肤色像素。在模型训练阶段,我们设计了一种在线学习的增量训练方式,在肤色分割阶段,结合使用了区域生长技术。实验表明,相邻像素之间的相似性,为彩色图像中的肤色区域分割,提供了重要的线索。   (2)现有的成人图像检测算法往往在整个原始图像或者原始图像的全部肤色区域提取图像特征。人体是成人图像最显著的前景内容,并且往往并不占满整个图像区域。因此,我们提出了ROI过滤算子的策略。该策略首先对原始图像进行肤色分割,得到图像的肤色图,然后对肤色图进行连通分量分析,提取原始图像的ROI,并将ROI的尺寸作为过滤器。如果检测到的ROI的长或宽小于45像素,那么原始图像极有可能是正常图像。由于成人图像中的人体对象往往比较大,因而,ROI图像过滤算子能以很高的置信度,有效地过滤掉大量正常图像。实验表明,ROI过滤算子可以过滤掉35.78%的正常图像,同时,只有0.05%的成人图像被当作正常图像。   (3)彩色图像中,前景对象周围的空间上下文往往包含着一些有用的语义信息。基于这一观察,我们提出在整个ROI上提取图像特征,用于进一步的图像类别判定。而且,从整个ROI上提取图像特征还能降低成人图像检测算法对肤色分割精度的依赖性。实验表明,与只在ROI中肤色区域提取图像特征相比,在整个ROI上提取图像特征取得了更高的灵敏度、奇异度和准确度。   (4)综合ROI过滤算子和在整个ROI上提取图像特征的策略,我们提出了一种高效的基于图像全局特征和SVM的成人图像检测算法。对于一幅给定图像,首先使用ROI过滤算子进行过滤。如果输入图像未被过滤算子判别为正常图像,那么进一步提取其ROI的颜色、纹理、形状描述子构成特征向量,使用SVM分类器进行类别判定。实验表明,该检测算法在一个由20,500幅图像构成的数据集上,能够达到96.05%的灵敏度、96.17%的奇异度和96.12%的准确度,检测速度为0.026秒/幅。
其他文献
由于我国的空间技术的迅速发展,航天嵌入式系统的复杂性急剧增加,导致星载嵌入式软件呈现多任务化的趋势。使用主循环加中断的方式开发星载多任务软件,存在以下几个问题:一、开发
非线性系统的分歧问题一直以来都是动力系统研究中的一个热门问题。它不仅在理论上有着重要的研究意义,而且还可以与自然现象密切相关,如对称磁场中的平面单摆运动、生物种群和
随着我国载人航天工程和地面互联网技术的快速发展,特别是建设载人空间站目标的确定,航天任务逐渐呈现多样性、长期性及国际合作的迫切性,这使得建设天地一体化互联网成为必然趋
网络虚拟化技术在未来互联网的研究中具有重要的意义,斯坦福大学提出的OpenFlow[1]技术由于其高度的开放性而受到了业界和学术界的欢迎,并且逐渐成为了网络虚拟化的主流技术。
随着云计算和大数据的发展,云数据中心的基础实施承载了大量的应用,云基础设施在运行过程中会产生大量的告警。由于云数据中心的基础设施规模庞大,导致云数据中心的告警产生规模
对程序进行分析和验证是当今计算机程序设计研究领域的前沿课题,如何保证程序按照人的预先设定严格执行而不出错是当今信息科学和可信计算技术与理论研究中的核心科学问题。近
Duckling是一个基于互联网的科研协同软件套件。“科研在线”是基于Duckling的一个应用,用于面向团队分享信息和知识,支持协同编辑和社会化沟通模式。科研在线能够让用户灵活地
随着人类生产活动不断发展和壮大,现代项目管理也越来越成为理论和实践关注的热点和焦点问题。在最近几十年里,项目调度问题也越来成为项目管理的核心领域,也吸引者众多学者和专
随着多媒体技术和网络的发展,人们对图像压缩技术提出了更高的要求,不仅希望它具有良好的压缩效率,而且还能灵活处理压缩码率。作为空中机器人的无人驾驶飞机,在民用领域可用于大
为保证移动节点在移动过程中会话的连续性,IETF提出了基于主机的移动IPv6协议(Mobile Internet Protocol version6,MIPv6)。MIPv6需要移动节点参与移动管理,降低了移动节点的续