结合注意力机制的改进U-Net网络在端到端语音增强中的应用

来源 :声学学报 | 被引量 : 0次 | 上传用户:meal09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
设计了一个适用于端到端语音增强的改进的U-Net (Attention Dilated Convolution U-Net,ADC-U-Net)网络模型.与基线U-Net网络相比,一方面通过加入空洞卷积减小由采样带来的信息损失;另一方面引入了注意力机制结构,结合了含噪语音更多的上下文信息,提取更深层次和更丰富的特征信息.与传统语音增强方法相比,所提模型无需提取特征、对特征去噪、重构语音3个步骤,避免了对显性特征的依赖,转而由网络模型通过多层次多尺度学习获得隐性特征.用多个主客观指标对增强语音的质量和可懂度进行了评价.实验数据显示所提算法在噪声抑制能力和对噪声的适应度方面均表现出良好的性能,与基线U-Net网络及其它模型相比,展示了良好的语音质量和可懂度.
其他文献
为了测量高频材料吸声系数,采用声模态分解的方法,基于阻抗管构建测试设备,在阻抗管内测量超过平面波截止频率的的高频吸声系数.测量过程中,通过在阻抗管的周向和轴向分别布置传声器阵列,分离管道内前3阶周向声模态以及各阶声模态的轴向传播入射波和反射波,从而得到最高频率达10000 Hz的材料吸声系数,并通过对比常规阻抗管测试方法的测量结果,说明采用声模态分解法对高频材料吸声系数的准确性.
期刊
针对金属板结构安全运行需要,开展了金属板结构疲劳损伤非线性兰姆波混频检测方法研究.通过数值仿真,研究了两列A0兰姆波与材料损伤间的非线性相互作用.结果 表明,两列共线A0兰姆波在结构材料损伤处产生单向传播的和频S0波,且和频波幅值随传播距离具有积累增长效应.对不同疲劳程度金属板试件进行了共线混频兰姆波检测实验,结果表明,和频波幅值随试件疲劳周数的增加呈单调递增趋势,提出的兰姆波混频技术可用于金属板结构疲劳程度的表征.研究工作为金属板结构疲劳损伤检测提供了可行的技术方案.
期刊
基于球形换能器发射的脉冲球面声波及其在同心球壳内壁的反射,应用机电互易定理,导出了在球面波发射回波声场中,用于校准球形换能器的互易常数.以此为基础,提出一种使用封闭球壳反射器的自易校准方法,通过一次测量即可得到球形换能器的5个基本电声参数.进一步,将自易法校准所得的电压灵敏度换算成平面波声场中定义的标准灵敏度,给出了换算系数.为确定该换算系数,发展了对换能器散射系数进行测量的方法.在25~63 kHz频率范围内,对半径10 mm的球形换能器实施了自易校准.结果 表明,测得的电压灵敏度的标准不确定度估计优于
期刊
In order to study the optimization configuration problem of bistatic sonar system,the optimal configuration model of bistatic sonar system was established.The positioning accuracy of the dual-base sonar at different dual-base angles was obtained by calcul
期刊
Emission of underwater acoustic orbital angular momentum (OAM) is studied as well as underwater acoustic communications with OAM multiplexing.Theoretical acous-tic properties for circular phased array are analyzed based on point source theory.We optimize
期刊
For underwater target detection using a single vector hydrophone,sparse asymp-totic minimum variance (SAMV) method is used to estimate the target bearing.The SAMV discretizes the entire scanning space and the target bearing is located at the position of t
期刊
针对声表面波传感器在生物检测中的性能评价与优化,提出一种快捷验证适用于生物传感器的声表面波器件质量负载灵敏度的实时检测方法.首先基于二维近似假设和周期性边界条件,建立了以石英为压电基底材料、SiO2为波导层的Love波传感器的三维有限元分析模型,从理论上验证了波导层对Love波传感器灵敏度的影响.在实验上,通过MEMS工艺制备以ST-90°X石英为基底的声表面波传感器,通过磁控溅射镀膜技术在其表面生长不同厚度的SiO2波导层.利用热蒸镀技术在器件延迟线区域生长铝薄膜作为质量负载效应,利用Tetrameth
期刊
2022年1月22日,黑龙江省声学学会第五次会员代表大会在哈尔滨召开,黑龙江省科协学会学术部部长吕强、中国声学学会理事长张春华、哈尔滨工程大学副校长殷敬伟,及来自哈尔滨工程大学、哈尔滨工业大学、哈尔滨理工大学等高校,中国航空工业空气动力研究院、中国地震局工程力学研究所、中国电子科技集团公司第49研究所等科研院所,大庆市玳璐科技有限公司等单位的91位会员代表出席会议,中国声学学会办公室代表列席参会.会议由第四届理事会副理事长乔钢主持.
期刊
A potential risk in ultrasonic guided wave testing is that weak echo signals from small defects may be submerged in noisy signals,which will cause missed detection.To over-come this shortcoming,a weak guided wave signal detection method based on period ju
期刊
Ultrasonic phased array technology has been gradually applied to industrial non-destructive testing in recent years.The sound field of the focusing and steering beam radiating from the phased array is a nonuniform distribution in the spatial position so t
期刊