语音情感识别中的分层特征与序贯识别

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:zhiping1209
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感识别技术具有广泛的应用前景,因此语音情感的识别研究具有重要的意义。本文以生气、高兴、中性、悲伤四种情感状态为例,对情感特征的提取、选择以及识别方法进行研究,主要工作概括为以下几个方面:  (1)针对基音频率特征参数提取过程中的传统中值平滑算法的不足,提出了一种改进的中值滤波平滑算法。实验结果表明,改进的中值滤波平滑算法比传统的中值滤波平滑算法能更有效地去除“野点”,可在一定程度上抑制噪声对邻域的影响,使基频轨迹与真实的轨迹更接近,达到理想的平滑效果。  (2)结合小波分析理论和分形维理论,提取了一种新的特征—小波分形维特征,突破了传统语音情感特征的局限性。使用GMM模型对时序性的小波分形特征进行建模,实验结果表明,小波分形的时序性特征对中性、悲伤两种情感具有较强的区分能力,可作为一种新的情感特征用于语音情感识别领域。  (3)不同的情感特征、识别方法对识别率的高低产生很大的影响。本文依次采用SVM、GMM分别针对全局性的情感特征、时序性的情感特征进行建模和识别,寻找区分各个情感类对的有效的情感特征。  (4)从情感维度理论出发,针对不同的两种基本情感状态适当组合与比对,采用不同的语音情感特征,对四种基本情感进行分层识别。四种基本情感状态的识别过程分两步进行:第一步利用一到两个分类器区分出(生气、高兴)情感组合与(中性、悲伤)情感组合两大类组合情感;第二步再针对生气与高兴基本情感、中性与悲伤基本情感分别提取不同特征和采用不同的分类器进行区分识别。这种序贯分类器识别方法有效降低了高激活维度情感与低激活维度情感之间的误识率,提高了四类情感总体的识别率。
其他文献
随着信息技术的迅猛发展和广泛应用,各企业都拥有着大量的信息系统用于企业的信息化建设。但是由于各个信息系统所采用的底层实现技术和平台都不尽相同,导致了各信息系统之间
当今时代,高校数字化校园建设正在蓬勃发展中,它是教育信息化的关键步骤之一。国内各大高校依照自身的实际情况和建设目标都在不遗余力的进行数字化校园建设,众多高校展开了
近年来神经网络的研究备受关注,大尺寸的神经网模型在应用中表现出优异的性能。大量的神经网络参数,如,神经元与突触连接,使神经网络具有计算密集和存储密集的特点,难以在资
随着信息化进程的加速,现代战争已经进入信息化时代,而信息战的一个重要组成部分便是战场通信系统。如何利用现代数字化和计算机可视化技术来武装和改造部队,并通过改变战场
随着信息技术的发展,各种形式的恶意代码日益增多,现在已经渗透到我们生活的各个方面。现有的安全软件大多需要依赖服务器的支持来更新病毒库,而且对于这些安全软件一直有盗
膜计算是生物计算中一个新的分支,它是从生物体活细胞的结构和功能中抽象出来的计算模型。膜计算也被称为膜系统或P系统。这个研究方向由罗马尼亚科学家Gheorghe.P un于1998年
我国配电网大部分为中性点谐振接地系统,在配电网架空线路的各类故障中,单相接地故障占比最大。在线故障检测和定位是智能电网自愈功能实现的基础,目前故障选线应用比较成熟,在线故障定位基于故障选线提出,目的在保证电力供应的情况下迅速确定、排除单相接地故障,提高供电可靠性。在线故障定位首先需要获取准确的配电网运行信息,配电网分布范围较广,分支繁多,物联网中的许多方法和技术,对准确、快捷采集电网运行时的状态信
近年来,面向服务架构(SOA)已成为系统集成的主要解决方案,SOA的提出在一定程度上解决了多个应用集成的问题。SOA架构的基础设施是企业服务总线(ESB),随着企业业务复杂度的增
随着计算机软硬件和互联网技术的飞速发展,云计算技术得到了广泛的应用。各种不同规模的云数据中心在世界范围内普及开来。然而,如此数量庞大的云数据中心带来的是一个严重的
僵尸网络是融合了当前计算机病毒、网络蠕虫和特洛伊木马等恶意软件技术的、能够可控的发起各种网络攻击活动的平台。在与安全研究者的不断对抗中,僵尸网络使用各种网络协议