基于音视频双重特征的视频内容分析技术研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:sabot
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和互联网技术的飞速发展,多媒体将越来越成为信息的主要载体进行传播。这在提升人们生活质量的同时,也带来了新的风险,尤其是对青少年来说,使得他们接触到某一类带有色情内容的视频的可能性更大、渠道更多。本文中,我们将该类带有色情内容的视频称为不良视频。因此,本文主要针对这类视频的特点进行研究,提出一个识别并实时过滤该类视频的方案,在特定类视频内容的分析技术上做出了一些新的尝试。基于视频的独特性,我们选择充分利用其信息量,采用结合音视频双重特征的分析方法,在视觉域和听觉域分别展开研究,分别针对该类特殊视频,分析并提取其区别于正常视频的特征参量,以用于后续的分类,最后综合利用两方面的分析结果,给出对视频内容的判断。在视觉域,我们主要针对肤色展开研究,首先通过颜色空间的变换、光线补偿、域值确定、纹理分析等技术提取出视频帧图像的皮肤掩码图像,之后研究敏感图像区别于正常图像的肤色信息分布规律,以提取有效的特征向量。在听觉域,我们主要针对敏感女声展开研究,通过分析并利用音频短时特征,实现对音频的分段,以提取出所有的可疑音频段,之后研究敏感女音段区别于正常音频段的特征,提取出有效的段特征向量。对提取出的特征向量,选择支持向量机(SVM)对其进行学习和分类,分别实现对图像帧和音频段的识别。最后,采用基于COM架构的DirectShow技术,对视频流进行实时的分析。首先进行音视频流的分离,并分别进行分析,在得到上文所提
其他文献
在下一代网络中,所有的通信网络是融合在一起的,现有电信交换网与IP网媒体网关控制器(MGC)间要完成信令交互与适配。这部分工作出信令网关SG完成。 本课题着重于SG实现方案
目前无线通信系统中主要存在两种传输方案,一种是传统的面向发送技术,比如联合检测技术,其缺点是在接收端必须做信道估计和复杂的检测算法,对于基站,可以实现这些复杂的处理,但是对
主元分析(PCA)方法是一种常用的人脸识别方法。由于PCA方法需要将图像从二维矩阵转化为一维向量,构造出巨大的协方差矩阵,并求解其特征值与特征向量,长期以来一直受到高计算复杂
随着通信技术和视频编解码技术的不断发展,电视和通信的融合技术--IPTV,逐渐成为视频多媒体技术的发展主流。 视频压缩编码标准是IPTV业务发展的一项关键技术,也是众多专家学
本论文主要针对无线移动信道多径衰落特性进行无线信号实测分析及无线信道物理层和链路级仿真的研究。 论文首先介绍了移动通信发展简史、无线电波传播的基本概念以及无线
CDMA是第三代移动通信中一种最主要的技术,而多载波技术为在移动环境所带来的高度不利的无线信道条件下传输高速数据提供了一种好的解决办法,将成为未来宽带无线传输体制的关键
回波是IP电话系统要解决的问题之一,也是媒体网关设计中的必要构件。和卫星等系统相比,媒体网关的电路容量巨大,因此大容量,模块化及高度集成化的回波抵消模块设计方案就成为本课
网络的飞速发展有目共睹,但是,在网络提供给人类大量信息与快捷方便通信的同时,网络也给人们带了许多不安因素,这些因素往往会引起巨大的经济损失。因此,网络安全变得越来越
Turbo码作为具有接近Shannon极限的纠错编码,由于其优异的性能引起国内外学者的广泛关注,一直是研究的热点课题。Turbo码之所以表现出接近Shannon限的优异性能,主要是由于它采用
自电视广播推出以来,电视技术经历了巨大的变革。特别是从本世纪90年代以后,随着电子技术,计算机技术,通信技术和网络技术的迅猛发展,电视正迅速走向数字时代,在世界范围内掀