基于MPEG-7视听特征的恐怖暴力视频检测

来源 :河北工业大学 | 被引量 : 3次 | 上传用户:zhengyunemo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体与网络技术的不断发展,网络上视频种类繁多,其中不乏大量影响青少年儿童身心健康的恐怖暴力类视频。然而,目前却缺乏有效的自动检测和过滤手段。传统的人工标注方法与基于单模态的视频检测方法已经不能适用于这个信息化社会,基于视听双模态特征的视频自动检测技术逐渐引起人们越来越多的关注,它为对日益增多的视频进行管理提供了便利。好的视频检测系统主要取决于视频特征的提取和检测算法的选取两个方面。本课题在特征提取方面,利用MPEG-7音频和视觉描述子进行恐怖暴力视频检测,通过对大量MPEG-7描述子的分析研究,根据待分类视频的特征,有针对性的提取了相应的音频、颜色、纹理、空间、时间、运动等特征,并对部分MPEG-7特征进行了补充和完善:增加了音频瞬时时间特性,得到对音色信息更加完备的表征;提出了新的利用权值计算视频主颜色的方法;自定义了视频运动强度描述子。在视频检测方法方面,采用基于BP网络的视频检测模型,并用遗传算法优化BP网络的初始权值和阈值,利用该模型融合音视觉特征,并对视频类别进行检测。采用上述方法,本文对恐怖暴力、音乐、动画、新闻四类视频进行了检测,取得了较高的查全率和查准率。实验结果表明,本文通过分析选择的特征具有代表性和区分性,即能有效全面表征视频特征,突出不同类别视频的差异,又不会因特征选择的盲目性而导致特征维数过高,降低了数据量;遗传算法优化的神经网络的融合模型提高了系统的鲁棒性;采用融合音视觉特征的方法与单模态特征相比明显提高了视频检测的效果。
其他文献
本文分析和利用超链接信息,即利用对链接文本和标题、所指向网页内容分析来对该链接文本(亦即对链接所指向的网页)进行分类并进行错标、漏标识别。本文首要提出网页中的链
本文首先在分析程序的网络接口的基础上,提出“两步生成,同步精化”的用例自动生成模型,并根据此模型设计和实现了基于网络接口的健壮性测试平台——NORTS。测试用例的
近年来随着分布式虚拟环境系统的广泛使用,对系统的交互性、实时性、真实感的要求越来越高,网络带宽和延迟成为了分布式虚拟环境的主要限制。由于分布式虚拟环境广泛采用三维
“试验”系列卫星计算平台的仿真研究是本课题的背景,通过建立面向卫星计算平台的软件仿真环境,可以有效解决卫星计算平台的测试问题,并可对卫星计算平台的研发起到加快
本文以中间件技术为依托,在中间件技术中关系数据转换到XML数据输出的构架的基础上,提出了一个关系数据转换成XML输出的中间数据转换模型VTree.不同于其他中间件中的数据转换
本文在基于句子级唇读识别的基础上,对唇读的基本技术问题包括预处理、唇动定位与特征提取、特征优化、唇读识别进行了研究和实践,具体包括以下内容:首先介绍了包含200个常用
本文主要针对目前的口腔手术术前清理工作中存在的难题进行了研究,并设计开发出了一种基于预测控制算法的口腔治疗仪控制系统。该系统利用预测控制算法产生控制信号,作用于驱动治疗仪的气泵电机,使得治疗仪容器内的气压值保持恒定,这样就能自动保持治疗仪的抽吸力度,使其在平稳状态下工作。从而解决了保持均衡的抽吸力度进行口腔术前清理这个难题。本文的主要研究工作包括:硬件、软件控制系统的设计,控制算法的研究以及改进,
本文首先给出了一个完整的层次化体育视频分析及应用框架,然后围绕着这个框架叙述了我们在不同层次上所进行的研究工作,包括低层的镜头检测,中间层的场景分类、高层的故事单
近年来,以云计算、大数据分析、高性能计算为代表的创新应用,给数据中心带来前所未有的压力和挑战,推动着数据中心的发展。在数据中心技术发展过程中,尽管出现了如软件定义网络/
本文首先介绍了匿名通信系统的有关概念、主要技术及模型.人们在研究匿名系统模型和协议的同时,逐渐将研究方向转移到匿名系统性能的测量上来;本文在这样的背景下,基于Crowds