论文部分内容阅读
近年来,随着人工智能技术迅速的发展,人与机器的语音交互越来越智能化。人机交互中的语音情感识别已是目前人工智能领域研究热点,使机器人拥有人一样的情感状态,这也是未来发展的一个必然趋势。本文主要研究基于卷积神经网络的语音情感识别算法。在卷积神经网络算法方面,本文先介绍了卷积神经网络的基本理论,随后针对卷积神经网络训练过程中的卷积核权值的更新算法进行改进,使卷积核权值的更新算法与迭代次数有关联,提高卷积神经网络的表达能力。在语音情感特征提取方面,本文介绍了常用的语音特征提取方法,选择提取语音特征应用最广泛的梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)方法进行实验,同时为了增加情感语音之间的特征差异性,将语音信号经过预处理后得到的梅尔频率倒谱系数特征数据矩阵做变换,提高语音情感识别率。对上述改进卷积神经网络的语音情感识别模型进行实验分析,实验表明,改进后的语音情感识别算法的错误识别率比传统算法减少约7%。除此之外,本文还在基于ARM(Advanced RISC Machines)的服务型机器人实现语音情感识别,设计了语音情感识别系统。根据嵌入式系统独有的特性,完成语音情感识别模块的移植。