论文部分内容阅读
语音信号的分离近年来成为信号处理领域的一个研究热点,它在电话会议、助听器及便携设备、机器的语音识别方面有很多的应用与影响。而盲信号处理的方法常被用于语音分离中去,“盲”是指没有关于源信号本身以及传输信道的知识,盲分离的理论基础是独立分量分析,其可以广泛的被应用于通信、图像、语音、生物医学、雷达、地震、声纳等多种类型信号的处理。本文详细研究了语音分离的基本理论,重点研究卷积混合频域解法模型框架下的语音信号分离算法。本文的主要工作如下:基于时域实值瞬时混合模型的盲分离算法已经研究的比较充分,但是在语音信号在现实中往往是卷积混合,而且在频域分离方法中信号是复值的,本文研究了利用复值信号特征的瞬时混合盲分离算法,对不同的复数域盲分离算法进行了编程实现,研究了卷积混合模型频域盲分离中的次序不定问题,提出了一种基于分离矩阵初始化的次序对准算法,并通过实验进行了性能比较和分析。卷积混合语音信号的频域盲分离算法的主要思想是利用傅立叶变换将混合模型在时域中复杂的卷积运算转换成频域当中相对简单的乘法运算,把时域中的卷积混合问题简化成为在频域中每一个频点上的瞬时混合分离问题。这样就可以运用目前已经发展相对比较成熟的瞬时盲分离算法,解出各频点的分离矩阵,再用傅立叶反变换,就可以方便地得到时域的解卷积滤波器,从而恢复出源信号。频域盲分离算法会带来普遍难以解决并影响分离效果的幅值不确定性和次序不确定性问题。不确定性是盲分离算法的固有问题,其对于时域信号而言并不会严重的影响到分离结果。但对于频域信号来说,在完成每个频率点的盲分离后,直接对各个频率点的分离矩阵进行逆傅立叶变换,不能够保证每个输出通道对应着同一个源信号的成分,很有可能夹杂了其它信号,从而使解卷积失败。解决次序不确定的方法又被称为次序对准算法。传统算法如相关性参数法和波达估计法鲁棒性较差,准确度不高,不能将分离和对准两步联合考虑,在逐频点对准时效果会较大受到前一频点次序对准以及第一步分离效果的影响。本文研究了相关系数法和波达估计法,并编程实现了波达估计法的次序对准算法,对波达估计法的性能以及其对最终分离结果的影响进行了分析;研究了上述次序对准算法存在的问题,并在此基础上提出了一种基于分离矩阵初始化的算法,该算法同样是利用几何信息的方法,可以在分离的过程中实现次序对准,相比传统算法鲁棒性较好,准确度较高,而且将分离和对准两步联合作为整体考虑;从而带来了在主客观评价指标上都较好的最终分离结果。频域盲分离的次序不定实际上仍然是一个棘手的问题,本文还介绍了利用信号频域相依性的新的频域盲分离模型,其理论上可以从本质上回避次序不定问题。