论文部分内容阅读
在语音信号处理领域,声源定位技术是一个重要课题。它广泛应用于多媒体系统、智能机器人系统、视频会议系统和普适计算等方面。声源定位技术是通过麦克风对声音信号进行采集,然后对采集的数据进行分析,从而判断声源位置的一门技术。在现有的定位技术中总是存在定位不精确和运算量较大的问题,如何解决这些问题是一个挑战。本文主要研究的是基于子空间的声源定位技术,在对现有的技术进行研究的基础上,提出了一些改进以期望达到更好的效果。本文首先对阵列信号处理以及语音信号处理中的一些基础知识进行了阐述,这些知识是下一步理论分析和实验的基础。接着本文介绍了多重信号分类(Multiple Signal Classification,MUSIC)的定位算法。由于麦克风阵列在收音的过程中,语音信号的幅度会产生较大的误差,使得距离定位的准确率下降。本文提出了一种提高距离定位的准确率的改进算法。此算法舍弃了不准确的幅度信息,利用较准确的相位信息,来对语音信号进行定位。本文进一步介绍了如何应用MUSIC算法处理宽带语音信号的问题,阐述了非相干宽带信号的处理算法(Incoherent Signal-subspace Method,ISM)的基本原理以及优缺点,并在此基础上根据语音信号的特点,提出了改进算法。实验表明,改进算法能够在子带数较少的情况下对声音信号进行定位。