论文部分内容阅读
在这个网络媒体技术高速发展的时代,人们接收信息的渠道变得越来越多,校园霸凌事件也开始走入人们的视野中。在互联网自媒体时代中,网络世界中繁杂的暴力、低俗信息对青少年的心智发展产生了严重的影响,有的学生甚至会去模仿接触到的暴力低俗行为,校园霸凌事件不仅影响了校园生活风气还对学生的心理发展产生了恶劣的影响,由此可见在校园中主动检测校园霸凌事件的重要性。本文分别从视频与音频两方面通过模式识别技术对学生遭受校园霸凌的情况进行及时判断,并且通过改进的DS融合算法对两方面的判别结果进行融合。基于校园监控视频并结合定向音频采集设备实现了对学生身心安全进行无间歇的实时监测,有利于构建和谐的校园环境。针对视频图像复杂的数据特征,本文首先对视频图像数据进行预处理,并通过搭建深度卷积神经网络来提取霸凌动作和日常动作数据特征。每16帧视频图像数据提取出一个4096维度的特征向量,在此基础上设计神经网络识别算法,该识别算法的识别规则如下:以16帧视频图像为基本识别单元对视频样本数据进行分割,对每一个基本单元进行一次判断,最终取所有判断结果的平均值作为最终识别结果,最终校园霸凌行为识别的准确率达到了92.00%,精准率达到了95.65%,召回率达到了88.00%,F1-Score值为91.67%,表明该分类模型性能较好。针对音频数据特征的复杂性,本文首先对音频数据进行预加重、分帧、加窗等预处理,其次对音频数据进行MFCC特征参数的提取,之后搭建深度卷积神经网络设计暴力情绪识别算法。本文暴力情绪识别算法的设计基于自制小型语音数据库、芬兰语音数据库以及CASIA公开语音数据库。针对自制小型语音数据库,该识别算法的精准率为88.33%,F1-Score为81.14%;针对芬兰语音数据库,该识别算法的准确率为95.00%,F1-Score为95.00%;针对CASIA公开语音数据库,该识别算法的准确率为91.67%,F1-Score为91.43%。本文中暴力情绪识别算法在3种语音数据库上表现出较好的性能,证明了该算法的通用性。最后,针对DS融合算法的局限性,提出了新的融合规则。并利用改进后的DS融合算法对视频与音频两方面的识别结果进行融合,其准确率为94.33%,F1-Score为94.07%,相比于改进前DS融合算法,该算法的准确率提高了10.19%,F1-Score提高了2.66%。