听觉模型与语音信号处理方法的研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:ymqlove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号处理中,线性预测分析技术广泛应用于综合滤波器、感觉加权滤波器以及对数增益滤波器,并且发挥着极其重要的作用。本文以提高编码算法的合成语音质量为目的对G728算法进行改进,提出了一种混合H-LPC(Auditory-Acoustic-Hybrid-LPC)系数,兼具听觉特性与声学特性。实验表明,提出的H-LPC可以改善合成语音的质量,对编码算法的研究有积极意义。   本文首先介绍了H-LPC的求解算法,LPC美尔倒谱系数(LPCMCC)是基于声学模型产生的,而美尔倒谱系数(MFCC)是基于听觉系统产生的,以二者的区别和联系为基础,求得H-LPC。本文围绕LPC的倒谱系数(LPCC)推导得出美尔倒谱系数(LPCMCC)的公式而展开,详细介绍并演示了公式的正向推导和逆向推导。基于原理分析与算法实现的不同,采用MFCC系数调整LPCMCC系数,使之能够最大程度地保留声学特性的同时,引入并增强其听觉特性,根据前述公式的逆推,再把这种听觉特性反馈到调整之后的LPC系数上,即H-LPC系数。   本文对LPC系数进行了PSD功率谱密度估计检测,目的是检测H-LPC系数在加入听觉特性后,声学特性是否损耗以及损耗的程度。为了实验结果易于比较,选用AR模型功率谱估计中的Yule-Walker法估计LPC与H-LPC的PSD,选用周期图法求解原始语音的PSD。实验结果表明,H-LPC的PSD与传统LPC的PSD相比,呈现出一定程度的减弱,但是已经基本达到目前LPC的应用要求,对于原始语音PSD的拟合度达到了90%以上。   具有后向基音检测的LD-aCELP编码算法,以降低码率为目的对G.728算法进行了改进,编码速率由16kbit/s降低至8kbit/s。本文在LD-aCELP编码算法的基础上,将H-LPC系数加入其综合滤波器中,得到合成语音,然后进行收听以及PESQ检测。实验结果表明,改进后的算法比LD-aCELP算法的合成语音质量高,加入H-LPC的LD-aCELP算法的平均信噪比SNR值和PESQ值都有所改进。
其他文献
随着物联网概念的普及和系统的不断发展扩大,物联网越来越呈现出数据量大、实时性高和网络环境复杂的特点,然而,物联网中的中间件属于数据处理能力有限的弱计算环境平台,当系
数据挖掘是近年来随着数据库技术和人工智能技术的发展而出现的一种信息技术,它融合了数据库、人工智能以及统计学等多种学科,试图从数据库中提取出先前未知、有效和实用的知识
计算机应用技术的快速发展,使程序的更新速度日益加快,对遗留系统的维护占用了大量的人力、物力。程序理解技术在一定程度上促进了维护人员对程序的理解效率,降低了维护和再开发
随着计算机软件、网络科学技术的发展,现今社会的信息化程度越来越高,每天都有大量的信息产生并被以时间序列数据的形式存储。面对如此庞大的信息量,如何利用这些数据序列成
随着计算机网络技术的飞速发展,数字多媒体的出现极大丰富了人们获取信息的手段,也方便了信息的存取和传输。然而,多媒体信息在传输过程中会遭到各种有意或无意的篡改攻击。
伴随着互联网的快速发展,Web信息量急剧增长,这也对我们使用互联网信息提出了巨大的挑战。如何准确、快速地从Web页面中提取所需信息己经成为人们利用互联网首先要面临的问题
无线传感器网络作为一种新的网络模式能够实时监测和采集网络分布区域内受测对象的信息,在现代社会生活中具有广阔的应用前景。任何一种技术,只有可以实际应用才具有价值,而
医学图像分割是医学图像处理、分析和理解的关键技术,其分割结果为后续的医学图像配准及三维重建提供基础数据集,近年来大量的学者都对医学图像分割的研究与应用给予了高度重视
随着以智能体技术为依托的产品在教育、医疗、娱乐、交通和通信等领域得到越来越广泛的应用,人类对智能体本身的可交互性提出了更高的要求。和谐的人机交互体验对于加速智能
随着移动通信网络的蓬勃发展和飞速建设,网规网优逐渐成为移动通信网中最关键的技术之一,关系着整个移动通信网运营的成败和网络质量,与网络运营商利润的增长有着密切关系。