基于卷积-长短时记忆神经网络的时序信号多粒度分析处理方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：wxiaof

【摘要】

：

时序信号是一种极其重要的信号,是指如语音信号、生物电信号、雷达和声纳信号、机械振动和地震信号[1]等等这样的频率、幅值随着时间的变化而不断改变的多成分信号。时序信号

【作者】

：

徐聪

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2017年期

【关键词】

：

多粒度特征融合卷积神经网络 LSTM 语音情感识别脑运动想象识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

时序信号是一种极其重要的信号,是指如语音信号、生物电信号、雷达和声纳信号、机械振动和地震信号[1]等等这样的频率、幅值随着时间的变化而不断改变的多成分信号。时序信号具有非线性和非平稳的特点,目前的绝大多数研究中都是基于信号是短时平稳的假设,特征的提取主要以频域特征为主,分析的层面和粒度相对单一。而且信号中极为重要的大部分时序信息被忽略,极大地影响了对时变信号信息的提取的能力,限制了其在实际应用中性能的提升。本文针对时序信号中时序信息的提取和建模问题,借鉴人脑认知过程中能够自动优选和整合多粒度、多时段和多层次特征的能力,提出了多粒度特征的提取和融合方法框架,我们将信号按照帧、段和全局三个粒度进行特征的提取,这样既保留了现有方法普遍采用的全局特征,又增加了帧粒度和段粒度这两个包含信号中时序信息的动态特征,有效地从多个角度对时序信号中的信息进行了提取,对信号中信息的表达能力也更加丰富。在段粒度的划分上,我们参考人脑在认知活动中的规律来进行窗长的划分。之后,我们将三个粒度的特征统一在帧的层面上按照时间的顺序进行了融合,再利用对时序信息建模能力比较强的LSTM神经网络模型来进行分类。在多粒度特征的具体实现上,我们采用了两个方法。一是利用传统的时频分析方法对时序信号进行帧特征的提取,再利用高斯函数组在段粒度窗下对帧特征进行卷积计算得到段特征,全局特征则是通过对所有的帧特征进行统计计算得到。另一个方法是结合目前在各个领域都有突破性进展的深度学习技术,借助卷积神经网络可以在原始数据上进行端到端的信息提取的能力,以及在多个层级完成特征提取的特点,来对时序信号完成多粒度的特征提取,提出了C-LSTM的网络结构。我们将待分析的时序原始信号直接输入到深度卷积网络中,通过预先设置好的卷积核在信号上进行滑动卷积,在浅层CNN中获得帧粒度特征,同时继续对帧粒度特征用更高层的CNN进一步加工,分别在中层和高层CNN输出段粒度以及全局粒度的特征。最后将三个粒度的特征信息在帧层面上按照时序进行整合,得到多粒度融合特征,并利用长短时记忆网络对时序信息进行建模与分类。最后,我们将所提出的方法框架和网络结构模型分别在语音信号上的语音情感识别分类问题以及脑电信号上的运动想象信号分类识别问题进行了实验。在语音情感分类问题上,我们采用了中科院自动化所在2016多模态情感识别竞赛中公布的数据集,共包含了生气、焦虑、厌恶、高兴、悲伤、惊讶、担忧以及中性这八种情感类别,与数据集的基线系统相比,将识别率提高了4%以上,并超过了竞赛第一名所采用的一种方法。在脑运动想象识别分类中,我们采用BCI2008数据集,是左右手运动想象的二分类问题。我们针对脑电多通道、具有空间分布特征的特点,在C-LSTM的基础上进行了改进,将电极的空间信息通过数据整合以及小波变换脑网络的方法融合其中,建立了3D-C-LSTM模型,并在识别率上相较其他方法提高了近10%,到达了92.0%,表明在脑电信号中除了时序信息之外,空间信息也是十分重要的。本文的研究工作为目前时序信号的分析处理领域中存在的一些关键性的技术问题提供了有效的改进方案,经过语音信号和脑电信号的相关实验证明,CLSTM的网络结构对于时序信号的处理具有普适性,具有一定推广价值。同时也为卷积神经网络等深度学习方法在时序信号处理中的应用与发展提供了新的思路和方向。

其他文献

基于Java RMI的广域分布式系统监控技术的研究与应用

传统分布式系统监控技术多关注位于同一物理区域内的分布式系统。随着分布式系统逐渐开始部署于全球不同地区形成广域分布式系统,目前的监控技术在安全性、网络通信及监控的

学位

Java RMI广域分布式系统远程监控插件

基于浏览器嵌入规划的非安全JavaScript检测与分析

作为一个客户端的应用程序，浏览器是用户和因特网之间进行交互的一个重要平台。现在存在许多与浏览器密切相关的恶意攻击，对用户浏览器安全造成了严重的威胁。此外Web2.0因功能

学位

检测规则Web安全浏览器嵌入规划保护机制Web应用程

基于计算智能的谱聚类方法研究

随着信息技术的快速发展,各行各业积累了大量的数据,如何帮助用户从这些数据中提取人们感兴趣的、隐含的、对决策有潜在价值的知识,已经成为信息技术领域的热点问题。作为一

学位

聚类分析谱聚类算法最小生成树遗传算法免疫应答计算智能

多摄像机环境下目标交接的研究

单摄像机的应用由于视野范围有限、视角单一等原因暴露出不少弊端,无法实现大场景的监控,也存在着难以解决的遮挡问题。因此,多摄像机的出现则成为必然,随之而来的关于多摄像

学位

目标跟踪多摄像机视野分界线目标交接

基于数据仓库的图书馆决策支持系统

信息技术在图书馆中的应用使得图书馆的工作面貌发生了本质的变化。面对从日常管理中产生的海量数据,图书馆管理者迫切希望从中获取有效信息来指导管理者决策。传统的图书馆

学位

数据仓库数据挖掘决策支持联机分析处理

分层强化学习中自动分层算法的研究

在强化学习的实际应用中,“维数灾难”问题一直困扰着其发展。虽然“维数灾难”问题是由待解决问题的本质所决定的,无法从根本上进行消除,但是却可以从方法上加以克服。分层

学位

分层强化学习子目标抽象机制时序描沭逻辑自动分层算法

基于UML状态图的测试用例自动生成方法研究

软件测试在软件开发过程中有着举足轻重的地位，它贯穿于软件定义与开发的整个周期及整个软件开发过程。而测试用例的生成设计又是软件测试过程中的重点与难点，它的设计主要来自

学位

MBTUML状态图Petri网测试用例

基于数据挖掘技术的激变变星的特征提取

天体光谱中蕴含了丰富的物理信息,随着LAMOST望远镜投入使用,每个观测夜将获得上万条光谱。传统分析光谱的方法效率低、速度慢,无法满足对日益增长的数据的处理。数据挖掘作

学位

数据挖掘分类聚类天体光谱激变变星

基于手机视频监控系统的SIP协议研究

随着IP技术的不断发展,基于IP网络的各种多媒体业务得到了迅速的发展。为了管理IP网络中的多媒体会话,必须要有信令控制协议。会话初始化协议SIP是一种重要的信令控制协议,其

学位

SIP视频监控安全身份认证

基于DM365的高清网络摄像机Web服务器设计

越来越多的人关注如何将嵌入式设备接入网络,其中最常用的技术是通过在嵌入式设备中植入web服务器。web服务器能给客户提供标准且友好的统一界面,使得嵌入式系统更加标准化和

学位

网络摄像机高清嵌入式web服务器(EWS)HTTP引擎安全模块标准模块DM365

基于卷积-长短时记忆神经网络的时序信号多粒度分析处理方法研究

其他学术论文