【摘 要】
:
语音转换是指改变一个人(源说话人)的语音个性特征,使之具备另一个人(目标说话人)的语音个性特征,从而使源说话人的语音听起来像目标说话人的语音的一种处理技术。该技术具有良好的
论文部分内容阅读
语音转换是指改变一个人(源说话人)的语音个性特征,使之具备另一个人(目标说话人)的语音个性特征,从而使源说话人的语音听起来像目标说话人的语音的一种处理技术。该技术具有良好的发展前景和巨大的应用价值。
本文首先对LPC倒谱和线谱对LSF这两种参数在语音转换中的应用进行了研究,并对它们的性能进行了比较;然后在现有的基音周期检测方法的基础上,提出了一种新的基于HILBERT变换的残差倒谱基音周期检测方法,该方法能够提高基音检测的准确性。
其次,重点研究了基于GMM的频谱包络转换,并对现有的CG-GMM方法进行改进,通过引入后验概率门限将GMM方法和VQ方法很好地结合起来,既避免了VQ方法带来的非连续又减轻了CG-GMM方法带来的过平滑。
最后,对谱激励的转换方法进行改进,基于MMSE准则,引入一个权重因子,将预测目标激励和残差波形转换这两种方法结合起来,获取比较好的激励信号。
本文利用MATLAB仿真,从主、客观两个方面对系统的性能进行评价。仿真结果表明,本文提出的改进方法能够取得较好的效果。
其他文献
在当今的社会发展进程中,无线通信无疑是最热门的研究领域之一,整个社会对于无线通信更高的要求促使无线通信技术的研究在近几年取得了突飞猛进的发展。中继协作通信技术不占
在移动通信网络中,越区切换是一种保证通信服务质量(QoS)的关键技术,一直以来备受关注。虽然现有越区切换技术已能暂时满足当前无线移动通信的需求,但近年来,随着高速公路、
图像融合是一项综合同一场景多源图像信息,得到一幅同一场景图像的技术,在图像理解和计算机视觉领域中有着重要的应用价值。从军事应用为目的的数据融合技术开始,融合技术已
本文主要提出了四种新的适用于雷达传感器网络(radar sensor networks,RSN)的分簇算法及相应的恒虚警(constant false alarm rate,CFAR)融合判决方法,旨在延长网络生命周期的
双/多基地MIMO雷达作为一种新兴的雷达体制,结合了双/多基地雷达和MIMO雷达的优点,能够使得目标定位精度得到提高,空间中弱目标检测性能得到改善并且具有射频隐身能力,这些优
近年来,国家对芯片国产化给予高度重视,并为此投入了大量的人力物力。随着国内电子信息技术的高速发展,特别是移动4G和互联网的普及,对多媒体图像采集技术的实时性和清晰度要求越
随着遥感技术迅速发展和新型传感器的不断涌现,人们获取遥感图像数据的能力不断提高。在利用这些多源遥感图像进行数据融合、目标变化检测、目标识别等多源协同处理工作之前,必须进行多源图像配准工作,配准精度的高低直接影响到后续应用效果的好坏。为此,本文主要研究了多源遥感图像间的配准技术,作为协同系统中的关键技术,要求配准方法在运算能力和配准精度方面都能够达到较好的效果。首先,本文对现有的多源图像配准技术进行
基于视频的行人检测与跟踪算法研究是计算机视觉领域的一个热点研究方向,该研究在智能交通、智能监控、机器人、视频浓缩与传输等领域都有着非常广泛的应用前景。然而,由于检
随着电能质量相关问题的重要性日益突出,电能质量监测问题成为当前各级电网企事业关注的核心问题。本文针对电能质量的特点,利用虚拟现实技术,开发并设计了电网电能质量可视化系
宽带相控阵雷达因其具有高分辨率、目标分类和识别的能力、空域快速电扫描、自适应抑制杂波以及能对密集目标进行检测和跟踪的能力,而被广泛应用于军事国防、经济、科学研究