基于深度学习和模糊理论的语音情感识别方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:liongliong432
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音交流是人类最直接和最基本的交流方式,人们通过语音可以表达自己的意愿及自己的情绪。随着现代科学技术的不断进步,服务机器人行业的发展也是日新月异,服务机器人与人类用户的交集变得越发紧密。相应地,人类用户与服务机器人相互之间的语音交流变得越来越频繁。如何让服务机器人在人机交互过程中能够识别人类用户语音中的情感状态是当前人机交互和服务机器人研究领域的一个重要热点。深度学习是当下人工智能的一个研究热点,深度学习模型具有强大的特征学习能力,并且深度学习在模式识别领域取得了重大成功。为此,本硕士论文研究和使用深度学习中栈式自编码器和卷积神经网络对人类的语音情感进行识别研究;同时,考虑到情感信息具有模糊性,而且由于这种模糊性的存在,使得语音情感识别时会对识别的正确性产生一定的干扰影响。因此,本硕士论文引入模糊理论的模糊规则推理对语音的模糊性进行处理。在此基础上,本硕士论文提出了一种深度学习模型结合模糊理论的语音情感识别新方法。该方法使用模糊神经网络的结构框架,并将模糊神经网络中的隶属函数用深度学习模型来代替,从而使得提出的新方法利用了深度学习模型的强大特征学习能力;同时,提出的新方法采用模糊神经网络的结构框架,结构框架中的模糊规则推理结构将深度学习模型学习到的特征作进一步的特征优化,从而处理语音情感的模糊性。本硕士论文使用CASIA语音情感数据库进行实验研究,验证和分析了栈式自编码器和卷积神经网络在不同模型结构和参数下的实验效果;经过对提出的新方法进行实验,验证了提出的新方法有效性,同时也指出了它的不足之处。
其他文献
借助环论的思想方法,提出了半环的弱理想概念.在此基础上,提出半环的弱同余概念,讨论它们的基本性质,得到一些相关结论,并且对半环的主弱理想进行了刻划.
近年来,国内高等职业教育已经取得很大的发展成就,但在职业教育发展过程中,我国高职院校德育中的重要组成部分——职业道德教育,还没有得到足够的重视。为了促使教育工作者对
汉、宋《诗经》学的差异表现在学术观点、《诗经》功能观与士人主体意识三个相互联系的内涵层次上。其中,学术观点是显性的,《诗经》功能观是直接的促动因素,而士人主体精神
本文探讨了职业院校“双师型”教师的角色创新、内涵演变和特征,分析了“双师型”教师培养对职业院校师资队伍建设的意义,并从政府层面、院校层面和教师个人层面提出了“双师
在排球比赛中,接发球质量的高低直接决定着二传手组织进攻的质量。在此,笔者结合自己作为教练和裁判的经历,对初中学生接发球失误的原因与改进方法做了进一步 In the volley
卵巢中始基卵泡是女性的基本生殖单位,也是卵细胞储备的唯一形式。传统观点认为,出生后卵母细胞数量不再增加,随着卵泡的发育、成熟和闭锁,卵母细胞不断耗竭,卵巢功能衰退,从