麦克风阵列语音增强

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:xyw6623
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
麦克风接收的语音信号通常被各种噪声污染,因此需要语音增强技术来提取有用信号。麦克风阵列语音增强一直是信号处理领域的一个研究热点,广泛应用于语音识别、视频会议和手机通讯等领域。麦克风阵列不仅能利用语音信号的时域和频域,还能利用源的空间信息来抑制噪声。麦克风阵列语音增强技术包括波束形成和盲源分离等方法。本文主要研究基于盲源分离的语音增强,它是一种能够同时提取多个目标源并且不需要源的先验知识信号处理方法。目前解决语音信号盲源分离主要包括为独立成分分析和时频掩蔽两大类方法。这两大类方法在存在混响和背景噪声的环境下分离性能都不够理想,为此本文提出相应的改进方法。   时频掩蔽是一种基于语音信号稀疏特性,对特征向量自动聚类的盲源分离方法,该方法对混响和背景噪声很敏感。为减小源空间参数的估计误差,本文提出了基于特征向量加权聚类的时频掩蔽方法,该权重由先验信噪比决定。为减少信号失真、串音和背景噪声,本文采用迭代的盲波束形成器,并结合使用语音幅度谱估计和时频掩蔽。   频域独立成分分析是一种基于源独立性假设的盲源分离方法。为减小混响的影响,本文将用于解混响的多通道线性预测器作为盲源分离的前置滤波器。为减少独立成分分析迭代次数,本文用时频掩蔽和盲波束形成的结果对频域独立成分分析做初始化,该初始化方法还能避免次序不确定性问题。此外本文还提出一种新的基于语音信号稀疏性的盲源分离后处理方法:基于局部最小比例控制谱减法,比常规的时频掩蔽和维纳滤波等后处理方法能更有效的控制音乐噪声,减小信号失真,提升分离性能。   本文还给出在线麦克风阵列语音增强系统,包括多通道线性预测、时频掩蔽和频域独立成分分析等。为增加系统的跟踪性能,本文提出一种新的变步长的独立成分分析方法。   实验验证本文提出方法在混响和背景噪声环境下有效性,信号失真比,信号干扰比较传统方法均有大幅度提升,并且计算量大大降低。
其他文献
随着移动智能终端的迅速发展、普及,人们对无线业务需求的日益增加,对无线通信的速率需求越来越高,加速了移动通信系统的演进;另一方面,据统计当前的无线业务中有70%的数据业务,50%
目前,卫星定位已经成为全球精确定位的主流技术,超宽带(Ultra-wideband,UWB)定位技术在短距离无线定位中具有无可比拟的优势。本文结合UWB技术和目前各卫星定位系统的特点,提
网络技术的迅猛发展以及信息系统的广泛应用促使数字信息呈现爆炸性增长趋势,并使其成为企事业单位最具价值的资产。目前,企业数据容灾首选面向数据中心的共享存储服务模式,
随着多媒体通信技术的迅猛发展,越来越多的用户能够在家中享受IPTV(Internet Protocol Television)服务。为了保证极佳的用户体验,IPTV运营商们尽力支撑高质量视频节目并确保
出砂监测是一种了解油气井出砂状况的重要方式,对出砂的效果、成本和油气井的产量有很大的影响。传统的出砂监测方法传感器与管道夹角固定,受流体流速影响较大。在监测气井出砂时,由于气带砂流速较快,砂粒撞击管壁的方向与水平面的夹角较小;而监测油井出砂时,由于油带砂流体速度较慢,砂粒撞击管壁的方向与水平面夹角较大。因此,在监测油气井出砂时,需要根据流体流速的变化不断调整传感器与管壁的夹角。但是,传统的油气井出
学位
音乐音符起点检测是基于内容的音乐信号分析处理的关键性环节。尤其对开启音乐检索领域新篇章的哼唱检索(QBH)系统而言,若加入一种高效快捷的音符切分程序,不仅可以在很大程
电子稳像是一种基于计算机的视频稳定技术,它主要是利用数字图像或视频处理的方法分离出运动矢量,进而确定图像帧间偏移量,最终通过补偿来获得稳定的图像序列。电子稳像技术
工件裂纹检测方法多种多样,相比价格比较昂贵的超声波探伤仪,荧光磁粉裂纹检测因成本低、灵敏度高以及检测速度快等优点而被广泛使用。由于传统的荧光磁粉表面裂纹检测主要依
遥感技术取得了长足的进步,己形成了由多种卫星为观测主体的强大观测系统。随着众多的高分辨率星载光学传感器的发射,获得的遥感数据规模越来越大,图片具有更清晰的结构信息和纹
高频谱效率、高可靠性以及低功耗是无线通信发展的趋势。协作通信技术利用地理位置上分散的中继节点构成的虚拟天线阵列来实现空间分集,不仅克服了终端由于尺寸的限制而无法安