面向情感语音合成的言语情感建模研究

来源 :北京交通大学 | 被引量 : 3次 | 上传用户：Linhan

【摘要】

：

语音作为人类重要的交际工具之一,除传递字面信息,还通过语气的变化传递情感。当前情感语音研究,主要集中于某些特定情感状态与语音信号关联关系的探寻,虽然观察到一些情感与

【作者】

：

高莹莹

【出处】

：

北京交通大学

【发表日期】

：

2016年01期

【关键词】

：

情感语音合成情感生成情感描述文本情感预测深度神经网络中间层可见化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音作为人类重要的交际工具之一,除传递字面信息,还通过语气的变化传递情感。当前情感语音研究,主要集中于某些特定情感状态与语音信号关联关系的探寻,虽然观察到一些情感与声学参数变化相关联的指向性线索,但由于情感表现的多样性和复杂性,导致情感声学参数的数值分布多呈现较大的离散特性。情感语音合成时,情感信息来源于人工指定或特定数据库分析,结合文本内容与场景因素的情感预测研究仍处于起步阶段。论文研究重点是基于文本分析实现言语情感预测,解决情感语音合成中文本-情感信息分析问题。研究主要涉及以下问题：1)相关的理论需要有所升华,尤其是要解决情感的准确刻画和动态衍化过程的描述；2)建模技术需要有所突破,考虑到影响情感因素及情感生成过程的复杂性,所需处理的特征参数可能会来自多个层面,模型应能支持多尺度特征处理及动态衍化过程刻画。针对第一个问题,论文在心理学、朗读学、播音学与语音学等相关理论和实践指导下,采用心理语言学、感知语音学实验和数据分析相结合的方法,探索汉语朗读或播音等创作型有声语言活动中情感表达与言语特征间的关联关系,进而对言语情感生成及衍化机制进行归纳。以此为基础,提出多视角情感描述方案,分别从认知评价、心理感受、生理反应和发音描述四种视角描述言语情感的不同侧面,各视角互为补充,共同构成言语情感的分布式表达。各视角之间依据言语情感生成过程形成直接或间接的衍化关系。发音描述作为言语情感生成过程的最终输出结果,形成连接情感描述与声学参数的接口,有助于发现二者之间更为显性的映射关系。基于该描述方案,构建了一个新闻言语情感数据库,通过言语情感标注的实施以及后续预测模型的建立验证了言语情感生成过程及描述方案的合理性。针对第二个问题,采用深度神经网络构建文本-情感预测模型；一方面由于深度网络的多层非线性映射结构与多视角描述模型的多层分布式结构一致,另一方面便于模型实现对情感动态衍化过程以及多尺度特征关联关系的建模。具体来说,暂不考虑文本内容之外的影响因素,利用主题模型提取文本的语义空间向量表示,依次预测篇章级、段落级和句子级不同尺度的情感信息。各尺度内部,形成由认知到心理、生理再到发音的衍化关系,发音描述作为最终目标,其他成分作为其子目标,子目标依次作为后续预测目标的部分已知信息参与到后续模块的训练；不同尺度之间,构成由上至下的层级结构,大尺度单元的预测结果作为小尺度单元的部分已知信息参与到小尺度单元的预测,为其提供更为全局的上下文参考。最后通过实验验证了所提方法的有效性,加入情感衍化关系以及多尺度特征间关联关系的影响,使模型最终预测结果的召回率、精准率和F1值分别相对提升了31.8%、10.3%和22.8%。本文工作的主要创新点在于：(1)基于言语情感生成过程的分析归纳,提出多视角情感描述模型：模型细致刻画了言语情感生成过程中各成分的变化及之间的衍化关系,并以发音描述作为连接情感与语音的接口,用于指导后续合成语音时声学参数的调整；(2)基于深度神经网络,构建文本-情感计算模型：模型综合考虑了言语情感生成过程中来自不同尺度特征的影响以及不同情感成分间的衍化关系,支持多尺度特征融合以及动态衍化关系刻画；(3)将先验知识引入深度神经网络,实现网络中间结构的部分可见化：通过网络结构的直接显性设定,有效利用了言语情感生成的先验知识,降低了训练数据与网络规模的开销,预测性能亦有所提升。

其他文献

山西平顺县野生药用植物资源调查与生态学特征分析

本文依托全国重点扶持的中药材基地—平顺县,以野生药用植物为研究对象,在野外调查的基础上,分析药用植物的区系特征、药用特征、多样性特征、生态位特征及种间的相互关系。

学位

野生药用植物入药部位种间关系多样性平顺县

“提高采收率”课程教学改革与探索

结合应用性人才培养模式,以石油工程本科专业任选课“提高采收率”课程为例,进行改革和尝试。从教材的选择、教学内容的取舍、教学方法、考核方式等方面探讨了如何提高专业任

期刊

石油工程采收率改革和尝试教学效果

仿古实木门质量控制措施

实木门具有天然环保、不变形、耐腐蚀、无裂纹及隔热保温等特点。同时,实木门因具有良好的吸声性,可有效起到隔声作用。图1,2是高级装修的双扇外门和双扇内门。室内木质门质

期刊

实木门控制措施

交通事故认定行为的属性及其司法审查可得性探析——困境与出路

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

会议

交通事故认定证据行政处不作为合法性审查

改良Endobutton系统重建治疗踝关节骨折伴下胫腓联合损伤

目的观察分析改良Endobutton系统重建治疗踝关节骨折伴下胫腓联合损伤的临床治疗效果。方法选取该院(2017年1月—2019年6月)收治的38例踝关节骨折伴下胫腓联合损伤患者,按照

期刊

改良Endobutton系统重建治疗踝关节骨折伴下胫腓联合损伤

企业会计电算化建设问题及解决对策

随着社会经济的发展、科学技术的进步以及“互联网+”思维在市场经济当中的渗透，企业的发展面临着激烈的市场竞争，为此企业要向获得长远的发展，必须优化内部管理，其中会计管理就

期刊

企业会计管理电算化建设途径可持续发展

无线传感器网络中的网络—信道编码研究

分布式编码是针对协作通信网络提出的一种有效的信道编码策略,可以改善协作通信网络中的传输可靠性。网络编码可以提高网络容量,在网络编码方案中,中继节点对从多个信源节点

学位

无线传感器网络分布式网络编码信道编码理论性能界不等差错保护

网络精密授时若干关键技术研究

随着网络技术的发展,网络与社会生产生活已密不可分。在国防工业电力电信等领域越来越多的网络应用需要高精度的时间同步,而传统的以网络时间协议(Network Time Protocol, NT

学位

网络授时网络延迟时间同步精密时间协议

电信网信息内容安全事件态势感知技术研究

随着电信网规模的日益庞大和通信技术的迅猛发展,电信网在用户数目和普及率、终端类型、业务种类以及与互联网络的融合程度等方面都呈现出了前所未有的蓬勃趋势。然而,也为电

学位

电信网信息内容安全事件态势感知态势觉察态势理解事件分类态势评估态势预测

从潜在被害人角度考虑解决校园暴力

分析校园暴力犯罪中被害人的自身因素以及尽快提升潜在被害人的自救能力，将有益于解决我国日益突出的校园暴力问题。$$1月16日，一段少女遭多人殴打、脚踹、扒衣服的视频被传到

期刊

面向情感语音合成的言语情感建模研究

与本文相关的学术论文