论文部分内容阅读
我们生活在声音的世界里。在嘈杂的环境下,我们很难获得理想的声源,并且交谈会变得不容易。因此从带有噪声的观测信号中获得我们想得到的目标源声源信号,对于人与人或是人与机器的交流来说,都是相当重要的一件事情。因此盲声源分离在人们的日常生活中是很重要的技术应用。另外盲声源分离技术在人和机器之间的声源通信信道建构也得到广泛应用。盲声源分离(BSS)是一种仅仅使用每个通道观测信号信息的估计源声源信号的方法。我们事先并不需要知道源信号的信息,包括频率特性、源信号空间位置或是源信号是怎样混合的,就可以执行这个估计过程。本文分别研究了声源信号在超定情况下(m?n)卷积混合和欠定情况下(m?n)瞬时混合的盲信号分离问题。具体的研究工作如下:1.首先本文研究了系统是超定的情况下,即从m个卷积混合观测信号中分离出n个源信号。具体步骤为:开始将时域观测信号通过短时傅立叶变换(STFT)转化到时频域。然后利用FastICA分离算法在频域分离观测信号,最后通过频点对换、幅度解混、时频掩蔽和逆短时傅立叶变换一系列操作,我们最终就可以得到估计的源声源信号。2.另外本文研究了系统是欠定的情况下,即从m个瞬时混合观测信号中分离出n个源信号,本文的研究仅考虑了源信号传播过程中幅度衰减和时间延迟的情况,而没有考虑声音混响的情况。分离过程中主要利用了观测声源信号在频域的稀疏性。我们的分离算法是在2路观测信号和3路源信号的实验条件下完成的。具体过程可以分为三个阶段:首先,在频域通过势函数聚类观测信号的角度,将观测信号按它们所属的源进行划分,这时可以估计出衰减矩阵。其次,对于每个划分,通过补偿一个可变时移,我们重新聚类观测信号的角度,直到聚类再次出现,每个可变时移就是时延矩阵的一列,这样我们可以估计出了时延矩阵。最后,通过上面得到的衰减矩阵和时延矩阵,再加上信号频谱系数的幅度是符合拉普拉斯分布这个假设。在混合方程的限定下,我们求得最小的信号幅度和。这实际上是一个二次锥规划的问题。这样我们就估计出了源信号。