论文部分内容阅读
盲信号分离指的是在原始信号以及信号传输通道均未知的情况下,仅仅利用传感器接收到的混合信号估计原始信号的一种技术。最近十几年来,盲信号分离已经成为了当前信号处理领域的研究热点之一。它在信号处理各个领域都有着广泛的应用,比如人机交互系统、无线通信、医学图像处理、声纳信号处理以及语音信号处理等。 在人机进行语音交互过程中,交互人的语音可能会混有旁观者的讲话声以及其它环境噪声,这一混叠将会极大的降低语音识别率。由于干扰源和混合系统均未知,要将多个人同时说话的内容分离开来,经典的信号处理方法难以获得较好的效果。鉴于人机交互系统这一具体应用环境,论文重点研究了非欠定多通道真实语音信号的盲分离问题,实现强干扰混叠背景下主说人语音的分离和增加,提高系统的语音识别率。 本论文在收集、整理、阅读和理解中英文文献资料的基础上,了解了近期盲信号分离技术的研究现状;相对深入地学习了信息最大化准则、最大似然准则、非高斯性准则、梯度法、自然梯度法、不动点算法等盲分离准则和迭代算法;针对初步确定的重点算法进行了深入理解及其算法编程与实验仿真工作。通过本阶段的研究工作,弄清了部分算法对于仿真混合语音信号和实录混合语音信号的分离效果。基于前期实验研究结果,提出了一种频域同时近似联合对角化混合信号在不同时延下相关矩阵的盲分离算法。该算法具体阐述如下: 根据语音信号的短时平稳性,将时域卷积混合信号通过加窗傅里叶变换生成对应的频域相乘信号,然后对混合信号的频域表示采用线性瞬时混合盲分离方法进行处理,即在白化预处理以后,同时近似联合对角化信号在不同时延下相关矩阵,得到相互独立的信号,再解决盲分离的模糊性问题,最后通过傅立叶逆变换得到分离后的时域信号。 实验仿真表明,该算法对仿真混合语音信号和实录混合语音信号均具有良好的分离效果且收敛速度较快。本文采用分离信号信干比及分离时间与另外两种卷积混合盲分离算法进行对比,本文算法分离信干比比其他两种算法高2~3dB且能节约10%左右计算时间。