基于HMM和RBF混合模型的语音情感识别

来源 :湖南大学 | 被引量 : 0次 | 上传用户:dianshenshizhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机学科的快速发展对人类社会产生了巨大的影响,人类与计算机之间的通信交流越来越成为计算机系统智能化、人性化的关键技术,新型的人机交互技术正在逐步地成为研究的热点。研究表明,在人机交互中需要解决的重要问题之一是“情感智能”的能力。目前,对于情感信息处理的研究正处在起步阶段,其中语音信号中的情感信息处理也越来越受到研究者的重视。语音情感识别是“情感计算”研究的一个重要分支,近年发展迅速,前景广阔。本文首先对情感语句进行了预加重、端点检测、分帧加窗等预处理,为了提取能够反映情感信息的特征参数,统计分析了能量相关、基频相关、时长相关特征在不同情感状态下的全局特征。在已经提取的语音信号特征中,选用基音频率的一、二阶差分,短时能量的一、二阶差分,10阶LPCC和10阶MFCC形成特征矢量,并归一化作为识别阶段的输入。介绍并分析了隐马尔可夫(HMM)模型和径向基函数神经网络(RBF)两种识别方法各自的优缺点。为了达到优势互补的目的,本文提出并建立了基于HMM和RBF的混合识别模型。针对每一种语音情感,设计一个HMM模型。HMM模型训练准则采用基于ML (Maximum Likelihood)的Baum-Welch算。在训练过程中,利用每一个HMM模型对情感语音信号进行状态分割,即采用Viterbi算法得到了最优化的状态序列。然后,采用勒让德系数进行正交基函数展开,将不等长最优状态序列向转变成固定维数的规整特征。在识别阶段,将HMM的状态累计概率输入到RBF神经网络进行识别,通过RBF神经网络的非线性映射能力进行映射。RBF神经网络的决策结果作为最终的识别结果。本文语料库采用CASIA汉语语音数据库,通过MATLAB实验仿真,分别在说话人有关和说话人无关的条件下,进行混合模型和单一模型的对比,结果表明,本文提出的基于HMM和RBF的混合模型的平均识别分别达到80.45%和69.31%。最后使用多数投票方法对分类结果进行融合,融合识别率得到提高。
其他文献
本研究以初级汉语学习者作为研究对象,通过语素识别和语素产出两种语素意识测试任务,以及听力理解测试任务,测量初级汉语学习者的同音语素意识和同形语素意识及其听力理解能力,采用相关分析和回归分析,对同音语素意识、同形语素意识与听力理解总成绩、判断对错、选择内容、对话理解、回答问题各部分成绩之间的关系进行了实证研究。研究结果发现:1.初级汉语学习者听力测试总分的平均值总体较高,初级汉语学习者同音语素意识得
YBa2Cu3O7-x(YBCO)/介质层/YBCO三层膜结构是超导电子学器件的基本结构,可用于制备电容器、约瑟夫森结以及微波器件等。但是,YBCO/介质层/YBCO三层异质结构的制备存在一些问
<正>《专利法》第13条规定:"发明专利申请公布后,申请人可以要求实施其发明的单位或者个人支付适当的费用"。行业内通常把这条规定称为"发明专利申请的临时保护",由于发明专
会议
对陕西省境内秦岭与子午岭地区7个具有代表性的紫斑牡丹(Paeonia rockii)天然居群进行系统观察和记录,采用巢式方差分析、相关性分析和聚类分析等方法对叶片、花、果实器官等
<正>自佛教传入中国以来,佛教研究逐渐兴起。1980 年代至今,中国佛教研究更呈日益蓬勃之势,在此过程中,金代佛教也逐渐进入学术界的视野。目前已经出版的金史著作,以宋辽夏金
目的分析全自动生化分析仪测定肌酐结果假性升高相关情况,为临床减少假性升高发生率提供参考。方法选取2011年2月~2013年2月接收的肾病患者30例,均采集晨起空腹静脉血,分别单
基础教育教学模式的改革探索,是提升学生综合素养和学习有效性的重要途径,是实现立德树人之关键。在基础教育教学改革中,"双主体"教学改革是教学改革的重要环节,它是指在主体
贺拉斯,古罗马文艺黄金时期文艺批评家和诗人,文艺理论专著《诗艺》不仅对西方文艺和美学思想影响深远,其中的一些分论点对翻译理论以及教育实践也有启示作用。本文客观分析
我省消防部队加强精神文明建设三年规划出台最近,省消防总队党委发出通知,将《河南省公安消防部队加强社会主义精神文明建设三年规划》印发全省消防部队。该《规划》是为落实党
本论文在对多模谐振器的结构与传输特性系统分析的基础上,针对现代无线通信系统小型化、多通带、低成本和高性能等需求,对双通带滤波器、差分滤波器以及并联反馈型振荡电路进