【摘 要】
:
语音增强技术作为语音信号前端的预处理方法之一,是目前数字语音信号研究领域内的一个热门方向,旨在从含噪语音信号中重构出接近原始语音信号的纯净信号。按照采集信号的麦克
论文部分内容阅读
语音增强技术作为语音信号前端的预处理方法之一,是目前数字语音信号研究领域内的一个热门方向,旨在从含噪语音信号中重构出接近原始语音信号的纯净信号。按照采集信号的麦克风个数,可将其分为单通道和多通道两种类型。本文采用多通道中的双通道情况进行语音增强的研究,因为它既符合人的双耳特性,又能合理使用语音信号的空间信息。由于机器学习方法的出现,一些新的语音增强算法先后出现。其中,利用非负矩阵分解方法进行语音增强效果良好,且其非负数据特性更具实际含义。论文主要工作是提出了一种无监督的广义互相关与非负矩阵相结合的语音增强算法,并根据实际需求对其不足进行改进,具体如下:1)对几种典型的语音增强方法进行了简单的探究,并介绍了基本非负矩阵分解方法的原理和算法特性。阐述了基于多通道的非负矩阵增强算法和麦克风阵列声源定位方法。2)针对传统单通道语音增强算法没有利用信号的空间信息这一缺陷,提出了一种将广义互相关方法与非负矩阵相结合的语音增强算法。该方法通过对输入混合信号进行字典预学习,然后随机初始化激活系数向量并进行迭代更新,从而可以逐帧推导出输入混合语音信号预学习字典的激活系数。此外,使用了最大池化广义互相关相变技术进行在线目标定位,不仅确保了算法的实时性,而且极大地保证了重构后的语音质量和辨识度。3)针对使用以短时傅里叶变换算法为基础的语音增强算法会产生固有延迟,提出了一种非对称短时傅里叶变换的窗口化方法代替传统的对称窗方法。该方法使用较长的分析窗和较短的合成窗相结合来实现算法的低延迟。实验证明,该算法能将固有算法延迟降低至2ms而不会降低语音的质量和清晰度。基于以上的这些特性,该算法具有一定的实用价值。
其他文献
道路目标检测技术是智能交通中的关键性技术,其目的是根据道路监控图像检测相应的道路目标,而道路场景背景多样、目标繁杂。现今主要是通过大型服务器计算完成目标检测,但一
近年来,中国GDP和人口城镇化的迅速增长,促使中国政府加大了交通行业的投资,城市路网规模得到了相应发展,但由于城市地形地貌、大型建筑物等外部环境因素的影响,导致城市路网
地面目标的立体视觉效果能够对城市规划和森林监测提供很大的帮助,合成孔径雷达(Synthetic Aperture Radar,SAR)的干涉成像技术,能够利用遥感的手段获取地面的高程信息,因此
随着科学技术的不断进步,各类电子产品层出不穷,对电子产品的质量要求也越来越高。电子产品在焊接过程会出现各种缺陷(如漏焊、焊锡粘连等),因此,对焊点进行缺陷检测是必不可
爆破块度是评价爆破效果的重要指标,建立爆破块度快速检测与评价的方法对矿山生产有着重要的现实意义。为此,本文将计算机图像识别技术引入爆堆块度的信息检测,针对露天矿山
基于柔性压力传感阵列的图形化成像技术在运动监测、人工皮肤和人机交互等领域有广泛应用。传统柔性压力传感阵列大都以高分子薄膜为基底,采用平面马赛克结构,器件与人体体表
随着科学技术的发展,智能人机交互技术的发展有望辅助不同程度失能患者恢复其生活自理,帮助失能患者与外界正常交流,减轻社会和家庭负担。在失能患者中轻中度完全失能患者虽
在数字多媒体时代,随着手机、照相机等拍摄设备的日益普及,图像越来越成为重要的信息载体,但是在图像的成像过程中,拍摄设备与成像物体之间很难保持相对静止状态,所以会造成
目前预付费刷卡终端在公共事业收费领域得到了广泛应用,然而采用GPRS传输数据的预付费终端多采用明文传输,存在数据传输的安全性和可靠性问题。论文采用嵌入式技术和基于混沌
在线决策是智能实体在非人为干预的情况下,进行自主决策的一种方式,在无人机机动决策、机器人控制和汽车无人驾驶等军用和民用领域都具有广泛的应用前景。相对于专家系统等传