噪声环境下阵列麦克风去混响算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:lianghaiyanps3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在办公室、会议室等其他室内封闭环境中进行语音通信、视频会议或者智能家居语音控制等行为时,说话人的声音不可避免地受到室内混响的干扰。因为当麦克风与声源超过一定距离时,麦克风通常会同时采集到直达声和由周围物体或墙面反射声波,造成较大的混响,且混响程度多变,将导致不同程度地降低语音的可懂度和清晰度,也会影响人的听觉感受和相关产品的用户体验。因此语音去混响技术具有重要的应用价值和研究意义。本文开始主要详细介绍语音去混响的研究意义和国内外研究现状;混响的基本原理,包括混响的产生,数学模型和特性等,还介绍了常用的语音预处理操作;语音质量的评价标准,以及本文用到的实验数据。然后又详细介绍了现有广泛应用的加权线性预测误差方法,并针对多通道去混响的应用进行了实验,结果表明简化模型对混响环境的模拟具有局限性,不能准确估计混响成分,当混响时间越来越长时,算法的性能也随之下降。由于该算法的过程相当于线性滤波器,所以在处理中不会造成语音失真,但是当混响严重时对混响成分的估计不准确,导致处理后的语音听感不流畅。深度学习算法能够通过非线性计算过程更好地达到去混响的目的,但是目前普遍存在的问题是当测试集与训练集混响环境不匹配时,算法的性能严重下降。基于该问题本文通过结合语音信号特点改进图像增强领域算法,提出混响感知结合多路密集连接神经网络去混响算法,同时构建带有混响程度等级分类标签信息的混响语音数据集。结果证明该算法能够有效改善目前深度学习去混响算法的不足,在多个语音评价指标中较传统算法具有明显优势。
其他文献
返乡创业或有意返乡者对此予以赞赏,乡村生活有序化和新变化得益于当地经济的健康成长和有志返乡青年对振兴乡村的美好向往。
透明电磁屏蔽技术兼具光学透明和微波(或无线电波)屏蔽的功能,在国防、通信、航空航天等领域有着广泛应用。透明导电薄膜受限于结构设计单一而陷入光透过率和屏蔽效能之间的矛盾。亚波长材料是一类周期小于波长的人工结构材料,可在亚波长尺度内对相位、振幅、偏振等电磁特性进行调控,其电磁响应与结构的排列组合方式有关。基于亚波长结构的金属网栅具有结构灵活、轻薄的特点,有望突破传统透明导电薄膜的光电性能限制。目前,基
国际产能合作是中国在新的时代背景下提出的一种国际经济合作模式,也是中国推动“一带一路”建设的重要举措。东盟作为“一带一路”沿线地区,其成员国是我国国际产能合作的重点国家。积极推进中国与东盟国际产能合作可以有效化解我国国内产能过剩问题,同时也将为东盟的经济建设做出巨大贡献,促进双方互利共赢。本文将在共生理论的视角下分析中国与东盟的国际产能合作,首先界定共生及共生关系、共生模式与共生度的相关概念,在共
性侵犯案件的频繁使得性教育受到社会上的广泛关注,但是系统化的性教育仍然未被普及。不论是幼儿园的老师还是家庭中的抚养者,对于幼儿性教育的内容及科学方式仍然处于一个相对欠缺的状态。而性教育不仅仅是预防性侵害的教育,更是为了树立幼儿的科学性意识、满足幼儿性心理的健康发展、提升幼儿的自我保护能力、尊重他人及他人隐私的能力。家庭作为幼儿成长的第一摇篮,除了在幼儿园以外幼儿园在家中度过了最多的时间,而养育者是
研究了轧制包覆法制备的碳钢/铝夹层带材的退火热处理工艺.利用OM,SEM,X射线衍射仪等分析了退火温度、退火时间等对复合界面金属间化合物生长的影响,在材料力学试验机上测试
由于纹理背景的存在导致图像缺陷检测结果不准确是目前冷轧带钢表面缺陷在线检测过程中存在的主要问题之一.针对该问题提出了一种基于小波的各向异性扩散图像滤波方法,该方法通过小波分解得到图像的低频和高频分量,并针对高频分量采用小波扩散系数对小波系数进行正则化处理,最后进行小波逆变换,重构滤波后图像.实验结果表明该方法不仅能够有效地滤除不必要的纹理背景信息,而且能够较好地保留图像的细节信息,具有更好的综合性