基于原型波形内插算法的语音问题的研究

来源 :北京化工大学 | 被引量 : 1次 | 上传用户:zhiyuanxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文主要完成基于原型波形内插(PWI-Prototype Waveform Interpolation)算法的语音编码和基于这一算法在汉语语音合成中声调调整方面的研究。原型波形内插(PWI)算法是美国AT&T贝尔实验室的W.B.Kleijn博士首先提出来的,这种算法利用了浊音语音的周期性,将浊音语音看作是慢变化的基音周期波形的连接,每隔20~30ms提取一单个的基音周期波形,然后在更新点处进行内插重建语音信号。本文系统介绍了原型波形内插(PWI)的基本原理及其实现方法,然后在对规则脉冲激励—长时预测(RPE-LTP)语音编码方案(13kb/s)研究的基础上,利用原型波形内插方法,提出了浊音语音4.8kb/s的编码方案,使编码速率大大降低。计算机模拟实验表明,这种编码语音质量与GSM编码方案质量相当。此外,本论文还研究了PWI算法在语音合成上,尤其在声调调整上的应用。传统的基音同步叠加算法(PSOLA)虽然具有良好的韵律调整能力,但是也有不足之处,当基音频率修改过大时有可能出现严重的谱包络失真,即共振峰特性产生不可接受的变异。本论文将PWI算法与PSOLA算法结合,对这一缺陷进行了改进。
其他文献
随着科技的高速发展和进步,过程自动化在现代化工工业生产中应用越来越广泛,其功能日趋完善。同时系统规模不断扩大,结构复杂性的日益提高,导致系统存在大量的安全隐患。这使
本文的研究目的是通过对现有混沌密码技术、同步方法以及各种混沌模型的特性的研究和总结,在混沌系统的固有特性、混沌保密方法的安全性与实用性方面作进一步的探索,针对混沌
图像增强是一类图像处理问题的总称。图像增强的目的是实现对图像的变换从而使得图像更适用于某些特定的应用。本文将探讨四类图像增强问题,即跨模态人脸合成、图像纹理平滑、
该文主要研究谐振软开关DC-DC变换器的建模与非线性控制等问题.主要的工作包括以下几个方面:由于开关元件和谐振环节的存在,准谐振变换器是一个时变的非线性离散系统,其电路
前馈神经网络在许多领域都得到了广泛的应用,然而其学习过程经常会变得很慢,容易陷入局部极小点,有时会陷入平坦区。研究导致这些问题出现的内在工作机制是神经网络界的热点问题
近年来,粗集理论在机器学习与知识发现、数据挖掘、决策支持与分析等方面获得了广泛应用.所以如何把粗集理论应用于生产调度中,在历史调度数据中发现成功的调度规则,建立起提
自治式水下机器人作为重要的潜水设备,它的研究不仅有重要的经济意义,也是军事和政治的迫切需要。本文所阐述的内容是在海洋非线性、非结构环境下自治式水下机器人(AUV)全局路
移动机器人视觉是指在移动机器人上加配视觉传感器,使移动机器人具备对未知环境有识别、检测和自主决策的能力。它在装配加工、智能家居、核事故处理、现代战争侦查等领域表
该文是作者于攻读硕士学位期间在人体运动分析方面所做研究工作的总结.人体运动分析是指从图像序列或视频中提取与人体结构相关的特征信息,并据此完成包括人体姿态识别、运动
作为一种市场机制,拍卖在日常的经济活动中占有重要地位,如电子商务、政府采购和艺术品转让等。“信息”是拍卖理论的基本和核心概念之一,而信息的不对称性是拍卖的主要特征,其对