基于跃层注意力机制的轻量化卷积神经网络的情绪识别方法和系统研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:gankai0319
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人机交互(Human Computer Interaction,HCI)是人工智能领域研究的热点方向,情绪识别是其中的重要研究内容。情绪识别是通过获取个体的生理或非生理信号对个体的情绪状态进行自动辨别,以实现更加友好和自然的人机交互。随着机器人产业和移动互联技术的高速发展,基于移动端设备的情绪识别研究不断深入,其中主要分为两个方向,一是在保证识别准确率的情况下对识别模型进行轻量化;二是基于信息融合的情绪识别。目前多数识别效果好的模型面临着参数量大、计算成本高的问题,不适用于移动智能终端等实际场景中;单一信息源的情绪识别信息不全面,导致结果可信度不高。针对上述问题,在系统分析现有卷积神经网络模型和情绪识别方法的基础上,本文展开了适配移动端设备的轻量化卷积神经网络模型研究;基于面部表情图像、语音的情绪识别研究;基于信息融合的情绪识别技术和系统研究。本文的主要创新工作如下:1.提出了一种基于跃层注意力机制的轻量化卷积神经网络模型LiSANet(Lightweight Skip-layer Attention Net)。该模型结构拓宽网络宽度,提取不同感受野下的特征信息,采用深度可分离卷积减少计算成本,并应用跃层注意力机制提高分类准确率,在Cifar-10数据集上取得了 90.30%的分类准确率。LiSANet相比主流分类网络VGG19取得了相近的分类准确率而模型参数量缩减了 80%、计算量缩减了 95%,比参数量和计算量相当的轻量化模型MobileNet分类准确率高了 3.62%。2.提出了一种基于LiSANet的面部表情情绪识别模型F-LiSANet,采用预训练和调优方法,提高了模型运行速度和准确率。在Fer2013plus面部表情数据集上进行训练和测试,与VGG19模型相比,测试集和验证集分类准确率分别高了 0.21%和3.44%,同时模型参数量仅为VGG19的30%,模型复杂度仅为其5%。3.提出了一种基于LiSANet的语音情绪识别模型S-LiSANet。以语音信息转化的声谱图作为输入,在语音情感数据集EMO-DB上进行训练和测试。本研究采用了增加随机白噪声的方法进行数据增强,使模型分类准确率提高了20%。4.研究了基于F-LiSANet和S-LiSANet的BP神经网络决策层信息融合的情绪识别模型与系统。在eNTERFACE视听情感数据集上,将模型进行融合训练和测试,得到分类准确率为90.16%,与单一信息源模型相比准确率有了一定的提升。根据训练所得的融合网络模型在智能移动机器人上搭建了情绪识别系统。
其他文献
随着人工智能技术与无人系统领域结合的相关研究不断深入和丰富,地面无人系统在物流运输、区域监视、灾区搜救等任务场景得到广泛的研究与应用。当前地面无人系统尚未到达完全自主的智能水平,复杂任务下仍然需要用户进行不同程度的协助以实现安全、可控以及效率最大化,由此可见可变自主系统对于当前无人系统的重要性和必要性。目前的可变自主地面无人系统仍存在以下几个问题:(1)地面无人系统目前缺乏通用的可变自主等级机制。
因双足机器人存在机械结构复杂、建模难度高、非线性强等问题,使得现有双足机器人的运动控制方法无法满足快速性和稳定性要求。本文针对双足机器人的快速步行运动开展研究,在力控制模式下设计了两种步行控制方法。即通过解耦控制设计了双足机器人姿态控制器、高度控制器、速度控制器和转向策略,以及基于模型预测控制和反馈控制方法设计了质心状态多变量控制器。最终在WUKONG-Ⅲ双足机器人上开展了快速运动和抗扰动实验。本
自主定位是腿足机器人的核心功能,与轮式机器人不同的是腿足机器人由腿部关节驱动实现机器人运动,其特殊的运动形式使得定位信息获取有一定的挑战性,包括腿足里程计的计算、机器人晃动情况下的位姿估计、大规模室外场景下的精确定位等。为了实现腿足机器人的自主定位,本文在现有机器人定位方法的基础上设计了 一种多传感器融合定位方法,主要对如何利用机器人本体传感器结合外部观测信息实现机器人定位问题进行研究,并进行相关
目的:基于Toll样受体9/髓样分化因子88/核转录因子-κB(TLR9/MyD88/NF-κB)信号通路研究白芍总苷(TGP)对MRL/lpr狼疮模型小鼠肾脏损伤的干预作用,探讨白芍总苷防治系统性红斑狼疮(SLE)的部分免疫学机制。方法:将SPF级MRL/lpr雌性小鼠随机分为4组:模型组、地塞米松组(0.15 g·kg-1)、TGP高剂量组(0.078 g·kg-1)和TGP低剂量组(0.03
球形机器人是一种新型的移动机器人,其具有球形外壳,滚动前进等特点。球形机器人滚动过程中的频繁晃动会导致图像模糊,使得基于视觉信息的定位系统设计具有一定的难度。此外,球形机器人特殊的机械结构,使得其轮速里程计的模型与常见的移动机器人不同,传感器融合的方式也具有一定特殊性。针对上述难点,本文针对球形机器人的特点设计了图像模糊度检测算法,并基于模糊图像检测,设计实现了以单目视觉为主的球形机器人多传感器融
哈里斯鹰算法作为一类新型群智能算法,受哈里斯鹰群狩猎行为启发而提出。哈里斯鹰算法具有原理简单、参数少、易实现、适合与其它算法结合、在高维问题上表现出色等优点,可用于求解各类寻优问题。也存在重点参数设置简单、低维问题上精度有限、过度依赖现有个体等问题。针对哈里斯鹰算法的不足,本文对哈里斯鹰算法进行了研究和改进,并应用于求解具有实际背景的优化问题。本文主要工作如下:(1)提出了一种改进哈里斯鹰算法(M
焊接作为制造业中一种重要的加工方法,在工业生产中得到了广泛应用。随着近年来制造业向着自动化、智能化的转型,对焊接过程的自动化、智能化需求也越来越高。现今的焊接机器人多以示教再现型机器人为主,对外部干扰的调节能力差,严重影响焊接质量。针对上述问题,本文基于双目立体视觉技术,重点研究T型焊接中焊缝检测技术,构建T型焊接自动化系统,具体工作内容如下:(1)介绍了双目立体视觉的基本原理,研究双目视觉的标定
火灾是最常见的灾害之一。一旦发生火灾,就会造成大量的人员伤亡以及重大的经济损失。因此,在火灾初期进行准确且快速的火灾识别具有重大的现实意义。随着计算机技术的不断发展,基于视频的火灾识别技术得到了广泛的关注。但目前基于视频的火灾识别方法仍存在误报率高等问题。针对以上情况,本文提出一种基于多传感器融合的火灾识别算法,并设计搭建了相应的系统平台对该方法的有效性与应用性进行了验证。本文首先分析了可见光与红
项目化学习是"三学三萌"科学微课程落地的主要形式,也是提升学生综合实践能力的重要路径。项目化学习是在情境中对问题展开探究,用项目小组的方式进行学习,运用各种工具和资源解决问题解决,最终产生公开交流表达的实践成果。在这过程中,用于引导学生项目化学习的驱动性问题至关重要,本文以《荷花池中的科学》项目为例作实施策略探讨。
随着现代流程工业技术不断发展,工业自动化系统逐渐趋向复杂化、信息化和智能化。新一代的信息技术将和传统制造业进行深度融合,把人员、机器、产品、数据连接起来,形成工业全生命周期的融合会聚。智能制造的升级能够加快我国工业制造业迈向高端、建设我国成为制造强国、在新的国际竞争中拔得头筹。而其中的数据整合分析与使用是实现智能制造的关键。随着传感器技术的发展,工业现场收集了大量数据。这些数据的来源不尽相同,数据