统计参数语音合成的硬件实现

来源 :西北师范大学 | 被引量 : 0次 | 上传用户：xiaoxu0911

【摘要】

：

语音合成技术应用于嵌入式设备更方便于人在日常生活中的做事效率，如基于语音处理的智能家电等。由于嵌入式设备内存空间和处理器速度的限制，较复杂的语音合成算法应用到嵌入式

【作者】

：

张帅

【机构】

：

西北师范大学

【出处】

：

西北师范大学

【发表日期】

：

2017年期

【关键词】

：

语音合成统计参数隐Markov 滤波器 S3C6410处理器

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音合成技术应用于嵌入式设备更方便于人在日常生活中的做事效率，如基于语音处理的智能家电等。由于嵌入式设备内存空间和处理器速度的限制，较复杂的语音合成算法应用到嵌入式设备上达不到实时处理的语音合成效果。而且大部分设备只能合成单一的语音信息。针对以上的不足，本文将基于隐Markov模型（Hidden Markov Model，HMM）的统计参数语音合成技术应用到嵌入式设备中。因基于HMM的统计参数语音合成方法是一种参数化语音合成方法，后端合成语音对语料库的依赖性不大，前端利用训练语料库训练获得相应的HMM模型库即可合成语音，且模型库很小，适合应用于嵌入式设备中。本文选用的硬件设备为飞凌OK6410开发板，其是基于ARM11的S3C6410处理器，最终在硬件上实现语音的合成。本文的主要工作和创新为：　　1．完成了统计参数语音合成的声学模型训练。在PC服务器上搭建了基于HMM的统计参数语音合成系统框架，利用准备好的训练语料库，训练获得语音合成基元对应的上下文相关的HMM声学模型，包括谱参数模型、基频模型、时长模型和聚类后的决策树等。以上模型下载到开发板的FLASH中，供后端语音合成使用。　　2．对语音合成后端的各部分算法和声学模型进行了硬件移植。首先在硬件开发板上建立Linux操作系统，然后移植了文本分析模块、参数生成模块、Mel对数谱估计(Mel Log Spectrum Approximation，MLSA)合成滤波器模块。其中文本分析模块是对输入的文本进行处理，得到待合成文本的标注文件。此模块单独封装成库文件，供后续的参数生成模块调用。在参数生成模块，首先根据提供的标注文件，利用决策树得到每个合成基元对应的上下文相关声学模型，然后将上下文相关声学模型组合成语句的声学模型，最后利用参数生成算法得到对应的激励参数对数基频和谱参数广义Mel倒谱参数(Mel Generalized Coefficients,MGC)，最后将激励参数和谱参数送入到MLSA合成滤波器中合成出语音。　　3．对系统进行了测评。主观评测和客观评测表明，本文开发的嵌入式设备上的语音合成系统能够实时合成较高音质的合成语音。

其他文献

A Mean-variance Problem in the Constant Elasticity of Variance (CEV) Mo del

本文通过对荣华二采区10

期刊

constant elasticity of variance modelmean-varianceoptimal strategy

三种草本植物的耐淹能力及其对深淹胁迫的响应

本研究从三峡水库消落带生态环境与植被恢复的生态学问题出发,研究了三种草本植物的耐淹胁迫及胁迫解除后的恢复生长能力,从生理生态学方面对其耐淹机理进行了探讨。主要结果

学位

网络视频监控系统自适应技术的研究

随着Internet的迅猛发展，流媒体技术逐渐成为网络应用的主流技术。在网络视频监控系统中，流媒体技术更是具有广阔的应用前景和研究价值，但同时面临着监控信息的实时性和IP网络的

学位

监控系统流媒体拥塞控制QosTCP兼容流控制协议自适应技术

三维地面场景红外仿真方法研究

该文以典型地面场景为研究对象,论述了三维场景的红外仿真方法.利用热力学模型和红外辐射理论计算了目标外表面的温度分布和辐射特性分布;利用随机生成与叠加相结合的方法生

学位

红外成像仿真计算机生成地面场景三维模型

一种开放式双MCP纳秒单幅相机及其应用

研制了一种开放式双MCP近贴单幅相机，相机用于毛细管放电Z箍缩等离子体软X射线激光的探测。相机包括近贴像管和控制电源两部分，其中控制电源是影响相机性能至为重要的一部分。文章首先论述了采用双近贴像增强器选通的超高速摄影机的工作原理及相机结构，阐明了实现选通的具体途径和方法，介绍了双近贴像增强器及用于高速摄影的双近贴管的特点。由于本相机所要拍摄的光谱为25-50nm的极紫外谱线，在该波段没有合适的光窗

学位

x射线单幅相机微通道板近贴聚像快门选通

超宽带雷达信号源

超宽带(UWB)雷达是一种新体制雷达,它的信号带宽很宽,具有高距离分辨率(HRR),在雷达探测、成像、精确定位、目标识别等技木中得到广泛应用.超宽带雷达的定义为相对带宽大于20

学位

超宽带雷达信号源DDS

单周期控制高功率因数PFC芯片研究与设计

AC/DC开关电源在日常生活中的广泛应用，带来了谐波污染等各种问题，影响电网安全。为克服AC/DC开关电源的缺点，功率因数校正（PFC）技术应运而生。功率因数校正技术通过强制输入电流波形跟随输入电压，可有效降低输入电流总谐波畸变率，抑制电网谐波污染，增加电网安全性。由于抑制电网谐波污染的国际标准的强制推行，以及PFC技术自身优点，该技术已经广泛应用于AC/DC开关电源设计领域。本文设计一款基于单周

学位

功率因数校正单周期控制非线性增益电流环路平均电流控制

斑翅蝗科蝗虫血细胞形态比较学研究

蝗虫是世界农牧业的重要害虫,中国目前已知蝗虫8科238属上千种,仅斑翅蝗科就有4亚科37属124种。蝗虫的免疫包括细胞免疫和体液免疫,而以细胞免疫为主。细胞免疫的主要作用方

学位

蝗虫血细胞形态学

大天区面积多目标光纤光谱天文望远镜(LAMOST)观测控制系统的设计与实现

观测控制系统(OCS)是九五大科学工程——大天区面积多目标光纤光谱望远镜(LAMOST)的重要组成部分,OCS是LAMOST观测运行的神经中枢,是一个高度自动化的、复杂的巨型望远镜观测

学位

观测控制系统天文观测天文望远镜

不同经营类型毛竹林土壤活性有机碳的差异

本文在庙山坞自然保护区选择粗放和集约两种经营类型的毛竹（Phyllostachys pubescens）林作为研究对象,通过设置典型样地,采用土壤分层取样和化学分析等方法研究了不同经营类型

学位

毛竹林集约经营轻组有机质土壤活性有机碳

统计参数语音合成的硬件实现

与本文相关的学术论文