语音声源特征分析及其在情感语音研究中的应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:xbzss123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机硬件水平的不断发展以及基于大语料库单元挑选和波形拼接方法的广泛采用,现有的语音合成技术已经基本解决了朗读风格语音合成的可懂度与自然度问题,语音合成相关的产品也越来越多的出现在人们的日常生活中。然而另一方面,人们对于语音合成系统的要求也日益提高,不再局限于简单的文本信息播报,而是希望机器能够具有与人类相似的通过语言表达情感的能力。因此,近些年来,具有情感表现力的语音合成受到人们越来越多的关注,也成为语音合成领域的一个研究热点。 与语音声源参数相关的“音质”特征是语音信号中表达不同情感的一个重要声学参数,也是情感语音研究的一个重要方面。本文以情感语音分析与合成研究为应用背景,提出了一种利用语音信号频谱中的声源相关特征进行语音频谱分解和声源参数度量的方法,整篇文章的结构安排如下: 第1章是绪论,在其中将简单介绍情感语音研究的内容、与情感表达相关的语音参数,重点介绍语音中“音质”特征的定义与描述,以及一些常用的声源分析与度量方法,并分析这些方法中可能存在的问题; 第2章中将详细介绍本文提出的基于语音频谱分解的声源参数提取方法,整个方法是在STRAIGHT语音分析合成算法基础上实现的,提出的方法包括两种,一种是基于混合高斯的频域建模与声源度量的方法,另一种是基于LF模型频域特征的声源参数提取算法,通过实验可以证明这两种方法在声源分析上的有效性; 本文在第3章中重点介绍提出的基于LF模型频域特征的声源分析方法在情感语音分析/合成中的应用,包括针对情感语音自然语流的参数提取效果评测、针对不同情感语音的声源参数对比统计等,并实验证明了通过利用该声源提取算法在情感语音合成系统中进行声源频谱的调整,可以提高合成系统的情感表现能力; 在第4部分中将对该声源分析方法在语音合成其他方面的应用进行介绍,包括语音信号基频调整、可训练的语音合成系统等。 最后将对全文进行总结,并指出现有方法中存在的问题以及可能的改进方法。
其他文献
目的:研究钢板螺钉内固定技术对四肢长管骨创伤骨折的治疗价值。方法:回顾分析2010年6月至2015年6月期间在我院治疗的72例四肢长管骨创伤骨折患者临床资料,将其随机分为对照组和
虚拟专用网络(VPN)能够在不安全的网络上为单独实体建立安全的专用信道。但是传统VPN具有费用高、安装配置复杂、可扩展性差等缺点,而SSLVPN可以弥补这些缺点,提供更为完善的远程
目的:心脏B超与心电图诊断高血压性心脏病的对比分析。方法:本文选取100例高血压性心脏病患者,分别对患者全部实施心脏B超与心电图诊断检查过程,对其不同诊断方式以及诊断检出率
目的:探讨调脾益肾法联合肠内营养支持治疗老年股骨颈骨折患者的疗效。方法:选择2014年9月~2016年6月在昆山市中医医院关节骨科住院的股骨颈骨折老年患者(年龄60岁~80岁)随机分为
随着无线终端设备的大量普及,无线通信成为近年来通信信息领域应用最广、发展最快的一种通信方式。由于用户对更高的数据速率和更好的服务质量的强烈需求,各大运营商旨在寻求
随着电信行业话音服务的增长和网络带宽资源的有限发展,传统话音传送网络已经不能满足日益剧增的业务需求和质量需求,所以提高话音传送效率意义显得格外重大。VoATM(Voice Tele
  智能天线是无线通信中的新技术,通过各种波束成形算法,能有效地减少同信道干扰,降低机站发射功率,显著提高系统容量和通话质量。特别在人口密集的小区,智能天线的作用更加明显
目的:探讨腹内压监测在综合ICU患者临床监护及治疗的应用价值。方法:选取2015年10月-2016年5月我院收治的综合ICU患者60例,采用经膀胱测压法对研究对象的腹内压进行监测,根据转入
目的:围绕儿科临床用药中的常见问题与对策,展开研究。方法:选取我院2015年6月~2016年4月收治的80例儿科患儿的用药处方作为研究对象,进行回顾式分析,对用药合理性进行评价。结果:本
随着在网络监控、流量计费以及支持QoS 的网络设备中流分类技术实现的功能复杂度不断提高,对已分类数据进行数据队列管理的难度也不断增大,成为整个系统成功的基础之一。同时