论文部分内容阅读
氦语音增强技术是保证潜水员顺利进行深海潜水的必要条件之一,国外在这一领域已开展了较多的工作,且取得丰硕的成果,而国内目前在这方面的工作甚少,尚处于初级研究阶段。本文介绍了氦语音研究的概况和发展历程,指出随着社会和科技的发展,氦语音转换为正常音的研究具有重大的现实意义。
本文基于经典的语音声管理论,分析了氦语音相对于正常音的变化规律,指出氦语音与正常音发音环境的差异是导致它们声学特性差异的主要原因,主要表现为共振峰发生非线性的偏移,而要将氦语音转换为正常音,就应修正这些差异。同时,本文对汉语氦语音进行了探索性的研究,采用实验对比手段,分析汉语氦语音的共振峰参数特征,得出结论:用于英语氦语音的增强处理算法同样也适用于汉语氦语音的增强。
氦语音增强算法的关键部分在于对偏移共振峰的增强校正。要实现氦语音增强,首先应能正确求得氦语音的频域共振峰曲线,再根据相关理论对特定峰值进行修改,使氦语音的频谱恢复正常。本文提出了一种改进的、基于线性预测(Linear Prediction,LP)的共振峰估计和修改算法,与传统的求根法以及峰值法相比,利用该算法可以较准确的求得氦语音的共振峰值,并进行修改,实现氦语音的增强。
在算法可行的基础上,本文还设计了一个基于线性预测模型的氦语音转换系统,它具有传输码率低、抗干扰强、音质效果较好、易于参数修改的优点。对于氦语音转换为正常音,主要是通过修改声道传输函数参量来实现。该系统完成了基于LP模型的英语连续音和汉语孤立音的氦语音到正常音的转换,恢复出的正常音音质虽不及正常发音的语音自然,但是人们能正确听辨,并能听辨出发音者的一些发音特征。因此,它具有携带发音人的发音特性、音质较好、便于应用的优点。