基于非负矩阵分解的语音增强算法研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户：mt0078

【摘要】

：

语音增强技术作为语音信号前端的预处理方法之一,是目前数字语音信号研究领域内的一个热门方向,旨在从含噪语音信号中重构出接近原始语音信号的纯净信号。按照采集信号的麦克

【作者】

：

王迎福

【出处】

：

江西理工大学

【发表日期】

：

2004年期

【关键词】

：

语音增强无监督学习多通道非负矩阵分解广义互相关低延迟

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音增强技术作为语音信号前端的预处理方法之一,是目前数字语音信号研究领域内的一个热门方向,旨在从含噪语音信号中重构出接近原始语音信号的纯净信号。按照采集信号的麦克风个数,可将其分为单通道和多通道两种类型。本文采用多通道中的双通道情况进行语音增强的研究,因为它既符合人的双耳特性,又能合理使用语音信号的空间信息。由于机器学习方法的出现,一些新的语音增强算法先后出现。其中,利用非负矩阵分解方法进行语音增强效果良好,且其非负数据特性更具实际含义。论文主要工作是提出了一种无监督的广义互相关与非负矩阵相结合的语音增强算法,并根据实际需求对其不足进行改进,具体如下:1)对几种典型的语音增强方法进行了简单的探究,并介绍了基本非负矩阵分解方法的原理和算法特性。阐述了基于多通道的非负矩阵增强算法和麦克风阵列声源定位方法。2)针对传统单通道语音增强算法没有利用信号的空间信息这一缺陷,提出了一种将广义互相关方法与非负矩阵相结合的语音增强算法。该方法通过对输入混合信号进行字典预学习,然后随机初始化激活系数向量并进行迭代更新,从而可以逐帧推导出输入混合语音信号预学习字典的激活系数。此外,使用了最大池化广义互相关相变技术进行在线目标定位,不仅确保了算法的实时性,而且极大地保证了重构后的语音质量和辨识度。3)针对使用以短时傅里叶变换算法为基础的语音增强算法会产生固有延迟,提出了一种非对称短时傅里叶变换的窗口化方法代替传统的对称窗方法。该方法使用较长的分析窗和较短的合成窗相结合来实现算法的低延迟。实验证明,该算法能将固有算法延迟降低至2ms而不会降低语音的质量和清晰度。基于以上的这些特性,该算法具有一定的实用价值。

其他文献

实时目标检测方法及其在交通中的应用研究

道路目标检测技术是智能交通中的关键性技术,其目的是根据道路监控图像检测相应的道路目标,而道路场景背景多样、目标繁杂。现今主要是通过大型服务器计算完成目标检测,但一

学位

实时目标检测深度可分离卷积YOLOv3nvidia Jetson TX2卷积神经网络

基于时空融合的城市道路交通流预测

近年来,中国GDP和人口城镇化的迅速增长,促使中国政府加大了交通行业的投资,城市路网规模得到了相应发展,但由于城市地形地貌、大型建筑物等外部环境因素的影响,导致城市路网

学位

城市道路交通流预测时空特性组合模型LSTM-RFGCN+LSTM

基于极化SAR干涉的森林和建筑高度重建方法研究

地面目标的立体视觉效果能够对城市规划和森林监测提供很大的帮助,合成孔径雷达(Synthetic Aperture Radar,SAR)的干涉成像技术,能够利用遥感的手段获取地面的高程信息,因此

学位

PolInSAR高度重建相干最优化相干散射模型

基于神经网络的焊点缺陷检测算法研究

随着科学技术的不断进步,各类电子产品层出不穷,对电子产品的质量要求也越来越高。电子产品在焊接过程会出现各种缺陷(如漏焊、焊锡粘连等),因此,对焊点进行缺陷检测是必不可

学位

焊点缺陷检测卷积神经网络语义分割

基于双门限阈值的爆堆岩块图像分割技术及图像识别系统开发

爆破块度是评价爆破效果的重要指标,建立爆破块度快速检测与评价的方法对矿山生产有着重要的现实意义。为此,本文将计算机图像识别技术引入爆堆块度的信息检测,针对露天矿山

学位

岩土爆破爆堆岩块大块率双门限阈值图像分割图像识别

基于摩擦纳米发电机的自供电织物压力传感阵列

基于柔性压力传感阵列的图形化成像技术在运动监测、人工皮肤和人机交互等领域有广泛应用。传统柔性压力传感阵列大都以高分子薄膜为基底,采用平面马赛克结构,器件与人体体表

学位

柔性传感摩擦纳米发电织物阵列

面向失能患者的舌控系统研究

随着科学技术的发展,智能人机交互技术的发展有望辅助不同程度失能患者恢复其生活自理,帮助失能患者与外界正常交流,减轻社会和家庭负担。在失能患者中轻中度完全失能患者虽

学位

失能患者舌机交互舌控系统腭位电极

基于生成对抗网络的图像盲去运动模糊算法

在数字多媒体时代,随着手机、照相机等拍摄设备的日益普及,图像越来越成为重要的信息载体,但是在图像的成像过程中,拍摄设备与成像物体之间很难保持相对静止状态,所以会造成

学位

盲去模糊深度学习生成对抗网络结构相似性循环多尺度

基于混沌AES的预付费系统

目前预付费刷卡终端在公共事业收费领域得到了广泛应用,然而采用GPRS传输数据的预付费终端多采用明文传输,存在数据传输的安全性和可靠性问题。论文采用嵌入式技术和基于混沌

学位

混沌AES预付费

面向在线决策的强化学习算法硬件实现及应用

在线决策是智能实体在非人为干预的情况下,进行自主决策的一种方式,在无人机机动决策、机器人控制和汽车无人驾驶等军用和民用领域都具有广泛的应用前景。相对于专家系统等传

学位

在线决策强化学习硬件加速倒立摆控制决策

基于非负矩阵分解的语音增强算法研究

其他学术论文