基于音视频的营区周界警戒关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:lostsoul8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来突发、异常事件逐年增加,面对这些问题,传统的人工监控系统越来越难以满足安全需求。尤其对于某些安全敏感区域,例如军警营区等场合的周界区域,出于安全管理的要求,需要对周边区域的人员进行入侵检测,当发现可疑目标进入区域,监控系统能够自动进行分析判断,有危急情况时,能及时发出警报并通知安保人员。所以智能视频监控系统成为主要解决手段,但由于监控场景的复杂性,单一依靠视频图像信息进行智能监控,有可能出现高漏警和高虚警。而异常事件往往发出异常声响,在一些地方,音频信号包含了比视频信号更直接的信息,它们能够及时有效地表示异常状况,可以增加对监控场景信息的掌控。因此,通过增加音频信息,可以弥补视频监控的不足。针对上述应用背景,论文分别就视频中行人检测、音频中异常声音识别两个方面开展研究,主要研究工作如下:首先,本文在传统的单纯依靠RGB通道模板和卷积神经网络的行人检测框架下,提出了结合多通道模板和卷积神经网络的行人检测方法。该方法一是采用运动侦测方法初步检测感兴趣区域,提高行人检测效率和降低虚警。二是采用多通道模板和最大值融合策略,降低单纯依靠RGB通道模板可能存在的行人漏检现象。通过行人入侵检测实验,验证了上述方法对营区周界警戒的有效性。其次,针对枪击声和爆炸声等异常声音的识别问题,本文提出一种基于M-MFCC特征和成对SVM的异常声音识别方法。该方法一是对MFCC特征提取方法进行改进,采用Hilbert变换取代傅立叶变换,增强枪击声和爆炸声等短时高能量声音信号特征的显著度和区分能力。同时采用前后半帧声音信号独立进行频谱变换和滤波的方式,减少冗余计算,提升特征提取效率。二是设计成对SVM分类器,一次实现三类声音信号的分类,解决了采用级联二元SVM分类器实现多类目标分类时运算效率低的问题。对比试验分析表明,论文所提方法具有较低的拒真率和认假率,可作为视频监控的有效补充。
其他文献
固相微萃取(Solid-phase microextraction,SPME)技术兴起于 1989 年,由Pawliszyn教授课题组首次提出,是一种新颖的样品前处理与富集技术。SPME的发展基于固相萃取(Solid-phas
烯酮是有机合成化学领域中十分重要的合成子,可以应用于各种类型结构的复杂分子的构建。近年来,针对烯酮化合物的催化反应新体系的构建同样备受关注,因此基于烯酮的反应活性
中国大鲵(Andrias davidianus)是现存大鲵种类中体型最大的一种比较原始的两栖动物,幼体用外腮呼吸,发育成体后外鳃消失改用肺呼吸。大鲵由从水生到陆生的过渡性身体结构和遗
鱼眼镜头具备超广角特性,与普通镜头相比可以摄取更多的信息,因此利用鱼眼镜头可以使用少量的图像即可覆盖整个三维空间,该设备在无人驾驶汽车、机器人导航定位、地理信息系
在工业过程中,一些重要的质量变量往往无法通过在线仪表实时测量得到,并且实验室离线分析可能存在比较大的时间滞后性和高成本的情况。软测量技术通过构建易测变量与质量变量
平面阵列电容成像技术是近代以来发展的一种极具创新性的无损检测方法,其不仅具有电容层析技术(Electrical Capacitance Tomography,ECT)的非接触性、响应快速、测量精度高等
随着微机械电子系统(MEMS)的迅猛发展,MEMS陀螺已经广泛应用于航空航天、惯性导航、智能电子、汽车安全等军用和民用领域。蝶翼式MEMS陀螺具备易于加工、灵敏度高、环境适应
气体传感器技术已经投入到对有毒有害,湿度,易燃易爆等气体的检测中。半导体氧化物传感器因其优异的性能以及成熟的技术,广泛的实践于科学研究中。目前的研究方向致力于提高
随着新技术的不断出现,目标识别从以往针对单源的研究向多源发展。不同类别的数据源从多个角度对目标进行描述,带来了数据量的激增,在拓展识别分类特征内涵的同时,也带来大量
荧光化学传感器因具有较高的选择性、灵敏度、较低的成本和较为便捷等优点,已被广泛用于生物小分子、阳离子、阴离子以及pH等方面的检测。由于有机荧光染料具有合成简单、结