基于流形学习与D-S证据理论的语音情感识别研究

来源 :江苏大学 | 被引量 : 10次 | 上传用户:woshcn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感识别是指利用计算机分析特定说话人的情感状态及变化,进而确定其内心情绪或思想活动,实现人机之间更自然更智能化的交互。语音情感识别的研究对于增强计算机的智能化和人性化,开发新型人机环境,以及推动心理学等学科的发展,有着重要的现实意义。本文首先综述课题的研究背景,并分析目前国内外已提出的语音信号预处理、情感特征的提取、特征降维以及语音情感识别方法。在此基础上,本文主要研究了语音情感特征降维、情感识别过程中的一些关键问题,提出了一些改进方法,并通过实验进行了有效性验证。本文的主要工作如下:(1)提出了基于增量流形学习的语音情感特征降维方法。由于语音情感特征参数较多,存在无关特征和冗余特征,本文提出基于增量流形学习的特征降维方法。该方法将从时间、振幅、基音、共振峰、MFCC系数以及Mel频谱能量动态系数上提取的101个参数作为初始特征,用Isomap将训练样本集的特征维数降至目标维数,再用增量学习的方法求得测试样本的低维特征,从而减少冗余信息的影响,提高分类识别的准确率。(2)提出了多粒度情感语音分段方法。通常长语句的语音情感分析是按固定帧数或长度比例分段从而进行情感特征的提取和分析,这种分段方法对语音情感分析结果的融合实现较简单,但未能充分考虑到语音情感信息完整体现。为了获得更完整与更丰富的语音情感特征信息,本文提出多粒度的情感语音分段方法,即按固定长度比例分段和按韵律结构分段的两种分段方法相结合,从而在这些分段的基础上进行语音情感分析和融合。(3)基于D-S证据理论的多粒度语段融合语音情感识别方法。分段完成后,得到的每个语段都被当成独立的样本来识别,原本的一个样本会得到多个识别结果,这时需要利用信息融合技术将这多个结果组合成一个结果。本文提出基于D-S证据理论的多粒度语段融合语音情感识别方法,在每个语段识别完成后,利用D-S证据理论将属于同一样本的多个语段结果进行融合,得到样本的识别结果。实验结果表明,该方法具有较好的整体识别性能,有效地提高了语音情感的识别率。(4)采用Matlab和VC结合的开发模式,设计实现基于增量流行学习及多粒度语段融合的语音情感识别原型系统,从实验角度验证了上述方法的有效性。
其他文献
在目前的大规模数据中心中,利用虚拟化技术来实现服务的资源调度和共享已成为主流,其中一种通用的方式就是把虚拟机作为服务的后台。在这样的情况下,当服务请求不停的切换和
当今社会,是一个对人才需求的社会,而考试作为一种较为常见的有效手段和方式,为我们选拔和考核人才做出了不可替代的贡献。目前很多单位、企业、公司,甄选人才、提高和考核员
学位
随着城市道路建设的发展,汽车数量的急剧增加,交通密度的大幅度提高,城市交通堵塞及交通事故频发问题日趋严重,从而迫切要求对交通监控实现自动化。而交通视频监控技术是实现这一
学位
随着嵌入式技术的不断发展,对嵌入式软件的数据处理能力要求越来越高。人们不得不将原本在企业级运用的复杂的数据库处理技术引入到嵌入式系统当中去,应用于嵌入式系统的数据
随着人类科技水平的提高,智能机器人技术得到空前的发展。RoboCup(机器人足球世界杯)作为机器人领域一项国际性的大型比赛,为在世界各地的众多从事机器人技术研究的科研人员
搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统
学位
近年来,利用在线生物文献构建图像数据库引起越来越多的关注,它包括文献中生物数据的自动收集、组织和分析。在线生物文献中图表及图表标题表示的数据包含研究结果等重要信息
目前,协同过滤推荐技术已在广告、电影、音乐等领域得到广泛应用。然而,在不同的应用背景下,传统的协同过滤推荐算法在兴趣偏好模型、相似性度量方法、邻居选择规则等方面仍
随着电子通讯技术和计算机技术的不断发展,我国计量表具(包括电表、水表、煤气表)的抄录、收费和管理正向着集中化、自动化、远程化的方向发展。目前城市内新建住宅小区现代
学位
随着数字产品的迅速发展,数字产品的安全性成为备受关注的课题。当今人们普遍采用密码技术来保证数字内容不被非法阅读,采用数字签名技术来确保数字产品内容不被冒充和篡改,