情感语音合成系统的研究与实现

来源 :太原理工大学 | 被引量 : 9次 | 上传用户:pipi1980_ren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的不断发展,语音合成技术在很多人机交互领域都得到了广泛应用。其中情感语音合成作为其中的一个重要分支,研究的是如何使计算机像人一样发出具有喜怒哀乐等带有情感色彩的语音。这个新的研究方向一经提出就引起了世界范围内研究者们广泛关注,情感语音合成技术也因此而得到了快速的发展。本文针对情感语音合成技术进行了有益的探索和研究,设计并建立了一套完整的情感语音合成系统。所做的工作主要归纳为以下几点:①首先总结分析了现阶段国内外对情感理论的研究,从众多分类标准中选取了悲伤、高兴、愤怒和惊奇四种典型基本情感作为研究对象。针对情语音情感研究的需要,设计建立了一种面向语音合成的情感语音库,包含悲伤、高兴、愤怒和惊奇四种情感,每种1000句,共4000句情感语音。其具体流程为:首先通过贪婪算法对语料进行筛选;然后利用图片诱发法对各种情绪进行诱发,并采集说话人发出的情感语音;最后将一种改进的模糊综合评价方法应用于数据筛选,对语音库中的语音从情感表达、清晰度、流畅度、情景感、自然度、噪音影响等六个方面的综合评定,客观而准确地验证了语料的可靠性。本语音库的建立为情感语音合成的研究提供了一个重要基础和前提工作。②分析总结了几种目前应用较为广泛的语音合成方法,其中基于HMM合成法具有建模时间短、可全自动无需人工干预、合成语音有较高的自然度与流畅度等优点,因此本文选择了该合成技术来实现情感语音的合成。③另外还通过数据库情感数据的研究,分析了悲伤、高兴、愤怒和惊奇四种情感下基频、时长和音强的韵律特征规律,并根据此规律总结出了一套情感语音修改方法。最终本文设计出了一个基于隐马尔可夫模型((?)HMM, Hidden Markov Model)的可训练情感语音合成系统,该系统包括情感分析模块、韵律参数修改模块以及语音合成系统三个部分。最后本文还通过实验验证了本系统的可靠性与实用性。
其他文献
<正>写字作画所用之墨,不知从何时诞生。但从《庄子》"吮笔和墨"的文字中,可以推测至少在周朝就已经有墨存在,不过当时制墨的原料与现在不同。从"墨"字的字形来看,是从"黑"从
期刊
<正>近几年来,经常可以看到一些有关中小学生自杀和杀人的报道,一幕幕惨剧令人触目惊心,生命教育成为一个严肃而现实的问题。由于长期以来忽视生命意识的教育,有的学生确实学
近年来,虽然石油企业的劳动安全工作取得了不少成绩,但是安全生产形势仍然十分严峻。就当前我国石油企业安全管理存在的问题及其原因进行了深入分析。
对不同类型的聚丙烯酰胺进行了煤泥水絮凝沉降试验, 考察其絮凝作用效果, 并研究了适合处理不同煤泥水的聚丙烯酰胺类型, 探讨了不同类型聚丙烯酰胺的絮凝作用机理。
<正>林业面积的增长以及林业经济的发展均离不开树木的种植,一直以来,植树造林都是我国林业工作中的重要内容。伴随着林业建设水平的提升,造林工作中的树木种植成活率也越来
期刊
针对交通摄像头自动调焦系统存在的采集频率不高、调焦精度较低、图像质量模糊等问题,在手动调焦镜头上加装电动调焦驱动装置。对整个控制系统进行测试,确认完成一次调焦约需
本文客观的对我国管理会计制度应用进行了分析,提出了目前存在的具体问题,剖析问题,提出观点,解决现存问题。
为了验证《结构共同规范》、《双壳油船规范》规定的非偏心梁和CSR散货船规范规定的偏心梁属性定义的合理性,采用一加筋板模型,利用MSC.Patran/Nastran对比在复杂弯曲状态下
<正>2018年6月,中国人民银行发布关于决定适当扩大中期借贷便利(MPL)担保品范围的通知,进一步加大对绿色金融发展的支持。这对金融机构而言,深入开展绿色金融工作,不仅是对国
<正>黑龙江省是林业大省,是全国重点林区之一。森林资源丰富,是我国北方重要的天然生态屏障,在维护国家生态安全、粮食安全、国土安全及促进经济社会发展等方面发挥着重要作