论文部分内容阅读
声场景分析主要研究如何在嘈杂的声音中感知环境事件。当各种声源同时存在时,人们将来自不同声源的声音信号区分开被称之声源分离问题,这是计算声场景分析的基础技术。 本文描述了一种能够有效分离混叠语音信号的系统。我们知道影响声源分离的因素有多种,想要实现混叠语音分离,必须知道人类听觉系统是如何从复杂的混叠语音流中得到属于各个源信号的信息的。 本文的主要工作可分为如下三个方面: 1、建立一个能反映人类听觉心理特征的新的听觉模型,混叠语音信号经过该模型后转换成为一系列频率分量。 2、将变换后的信息转换成可以按照不同声源分组的感观要素。在此基础上,对上述过程所得到的感观要素按不同声源加以分组。 3、最后,利用来自同一声源的感观要素重新合成或重建感兴趣的语音源信号。 经实验证明本文所提出的混叠语音分离方法是有效的。