基于多目标联合优化的语音增强方法研究

来源 :信号处理 | 被引量 : 0次 | 上传用户：luocaohuozi12345

【摘要】

：

语音增强旨在从受噪声干扰的语音中提取目标语音,目前基于神经网络的语音增强方法在提升语音质量和可懂度方面已被证明是有效的.通过多目标联合优化,利用不同特征之间的互补性,可以提升基于神经网络的语音增强方法的性能.然而,这类多目标学习的语音增强方法在网络优化过程中,通常分别对单个输出目标进行损失函数的计算,多目标之间是并行的,并没有充分利用多目标之间可能存在的关联.为了在网络训练过程中增加输出目标间的关联,本文利用长短时记忆网络构建一种双输出系统框架,设计一种多目标损失函数计算策略用于网络训练.该框架估计出目标

【作者】

：

谢福仕康迂勇施明月郑能恒

【机构】

：

深圳大学电子与信息工程学院,广东深圳518060

【出处】

：

信号处理

【发表日期】

：

2021年10期

【关键词】

：

长短时记忆网络多目标损失函数语音增强

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于改进池化层的弱标记声音事件检测

针对DCASE2017挑战赛任务4提供的大规模弱标记声音事件检测数据集,我们搭建了基于梅尔滤波器特征(Fbank)、卷积神经网络(CNN)以及循环神经网络(RNN)的多类别声音事件检测系统,分析了 attention和lin-ear softmax两种已有的常用池化层在神经网络反向传播中的部分推演过程,并在linear softmax池化层的基础上进行改进,提出了一种“指数可学习的幂函数softmax”池化层.实验结果表明,相比于DCASE竞赛中获得第一名的模型,应用“指数可学习的幂函数softmax”池

期刊

弱标记声音事件检测池化层指数可学习的幂函数softmax

无线信道预测:联邦学习与集中式学习的通信开销

通过预测无线信道可以解决高速移动导致的信道过时问题、或利用预测资源分配提升无线系统的资源利用率和用户体验.尽管对机器学习进行离线训练的时间较长,但利用训练后得到的模型进行在线推断时计算复杂度低,有望解决信道预测这类对实时性要求高的无线任务.联邦学习可以充分利用移动设备采集的数据和计算资源,同时保护隐私敏感的用户数据.对于隐私不敏感的无线数据,应用联邦学习的主要动机之一是相对于需上传原始训练数据的集中式学习能降低通信开销.本文考虑平均信道、瞬时信道和未来接入小区这三个预测问题,对经过模型压缩后联邦学习的上行

期刊

联邦学习通信开销无线信道未来接入小区

基于延时多普勒对齐的组网雷达点源干扰抑制算法

针对组网雷达被单点运动辐射源干扰情况下的目标检测问题,本文利用目标多角度回波在传播延时、多普勒以及散射特性上存在差异的特点,设计了一种基于干扰延时、多普勒对齐的自适应干扰抑制算法.本文首先建立了单点运动辐射源干扰条件下的组网雷达信号模型,其次对抑制算法进行了详细介绍,最后通过典型场景的仿真分析验证了所提算法的抑制效果.仿真结果说明,所提算法可以充分利用目标在距离多普勒域的稀疏特性,实现干扰的有效抑制.

期刊

组网雷达自适应处理数据融合

基于反射信号时域重构的探地雷达超薄层状介质参数反演方法

探地雷达实际应用场景中介质表面往往存在着其他覆盖物,将会严重影响实际探测效果,如冬季路面表面的冰层、沥青铺路时防止沥青混合物粘在滚筒表面而喷出的水汽层等,且这些覆盖层的厚度较薄,通常小于探地雷达可分辨的最小厚度.因此,本文提出了一种基于反射信号时域重构的层状介质参数反演方法,利用广义反射系数建立雷达发射回波的时域模型,再通过遗传算法对模型的代价函数进行优化进而反演出覆盖物薄层的参数.最后,通过时域差分工具gprMax仿真软件模拟沥青混凝土实施铺路场景,对所提算法的有效性和准确性进行验证分析.

期刊

薄层介质反演广义反射系数探地雷达遗传算法

基于Python语言和Abaqus软件的轮胎参数化高效建模技术

基于Abaqus软件提供的Python二次开发接口,研究复杂结构轮胎的参数化高效建模方法.建模过程如下:结合宏录制功能录制所需Python代码,修改参数后生成脚本文件,采用RSG对话框创建轮胎建模插件,输入轮胎结构关键参数后可以一键生成轮胎有限元几何模型.该方法将原来需要数小时才能完成的轮胎建模缩短为几秒钟,极大地提高复杂结构轮胎的设计效率,为后续轮胎有限元仿真分析奠定了较好的基础.该技术可以推广应用于飞机、轮船、汽车等的其他复杂结构零部件的高效建模中.

期刊

轮胎结构高效建模插件参数化AbaqusPython

不同品种炭黑混炼胶的加工流变性能研究

研究不同品种炭黑混炼胶在不同测试条件下的加工流变性能.结果表明:炭黑N550的混炼加工性能好,炭黑N134混炼时更易聚集,分散差;混炼胶的门尼粘度和结合橡胶含量随着炭黑结构的增高和比表面积的增大而增大,与炭黑CDBP吸油值的相关性好,相关因数均为0.95;混炼胶的Payne效应与炭黑比表面积和应力松弛面积的相关性好,相关因数均为0.98;混炼胶的挤出胀大比受混炼胶中结合橡胶和包容胶含量的双重影响.

期刊

炭黑混炼胶加工性能流变性能门尼粘度应力松弛结合橡胶Payne效应

认知频控阵雷达对随队假目标的动态零陷形成研究

电子战环境中,随队支援式假目标可在雷达照射主瓣内做非线性运动,这对基于相控阵体制的雷达实时地将波束零点对准假目标位置造成了困难.针对这一问题,提出一种基于频控阵雷达的动态零陷形成技术,系统通过从环境中提取干扰假目标距离信息,之后结合认知技术利用扩展卡尔曼滤波器获得假目标运动的外推轨迹,并将预测信息通过反馈回传至雷达发射模块,通过频控阵距离维波束形成技术调整发射权矢量使得波束零点指向干扰源预测位置.仿真结果表明:所提方法可以有效地实施对主瓣内运动的欺骗式假目标动态零陷,相比于不基于预测信息的波束形成技术具有

期刊

频控阵认知雷达自适应波束形成

基于子带处理与Volterra自适应滤波的广播音频信号相似性检测方法

由于广播节目受众广,影响力大,其播控要求高,对错播、插播、漏播等异常播出情况容忍度低.针对广播节目播出实时监测问题,本文提出了一种快速的广播音频信号相似性检测方法.该方法计算Pearson相关系数来判别两广播音频信号是否相似.然后,为了抵消编解码器、收发设备及传输信道的影响,应用自适应Volt-erra滤波器来处理信号.最后,用子带分解技术将全频带信号分解为子带信号,并仅对功率最高的子带进行分析预处理,以降低计算量.实验结果表明,在考虑了真实的传输影响后,通过不同条件的比较,该方法具有良好的检测准确度,且

期刊

音频对比自适应Volterra滤波器子带滤波时延估计实时广播音频

圆周扫描地基SAR频域三维成像算法

圆周扫描地基SAR(GBCSAR)是一种具备三维成像能力的地基SAR系统,其运动轨迹特殊,给三维成像带来难度.后向投影(BP)算法适用于该系统成像,但其计算量巨大,难以实现实时成像.应用于机载圆迹SAR成像的频域算法由于机载圆迹SAR与GBCSAR系统在成像模型和信号模型上都存在差异,因此无法应用于GBCSAR.因此,本文提出了一种针对GBCSAR的频域三维成像算法.本文在GBCSAR系统模型的基础上,推导信号由斜距平面转换到成像平面的解析表达,在频域进行匹配滤波,实现信号的聚焦.之后对本算法的适用条件进

期刊

圆周扫描地基SAR三维成像频域成像算法

氧化石墨烯对绿色轮胎胎面胶用复合材料结构与性能的影响

研究氧化石墨烯(GO)对绿色轮胎胎面胶用复合材料[GO/天然橡胶(NR)/溶聚丁苯橡胶(SSBR)复合材料]微观结构及动静态性能的影响.结果表明:添加适量GO有利于白炭黑在橡胶基体中的分散;随着GO用量的增大,GO/NR/SSBR复合材料的定伸应力、拉伸强度和撕裂强度逐渐增大,当GO用量为4份时GO/NR/SSBR复合材料的物理性能最佳,当GO用量为2份时GO/NR/SSBR复合材料的动态力学性能最佳.

期刊

氧化石墨烯天然橡胶溶聚丁苯橡胶绿色轮胎胎面胶物理性能动态力学性能耐磨性能

基于多目标联合优化的语音增强方法研究

与本文相关的学术论文