基于多目标联合优化的语音增强方法研究

来源 :信号处理 | 被引量 : 0次 | 上传用户:luocaohuozi12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音增强旨在从受噪声干扰的语音中提取目标语音,目前基于神经网络的语音增强方法在提升语音质量和可懂度方面已被证明是有效的.通过多目标联合优化,利用不同特征之间的互补性,可以提升基于神经网络的语音增强方法的性能.然而,这类多目标学习的语音增强方法在网络优化过程中,通常分别对单个输出目标进行损失函数的计算,多目标之间是并行的,并没有充分利用多目标之间可能存在的关联.为了在网络训练过程中增加输出目标间的关联,本文利用长短时记忆网络构建一种双输出系统框架,设计一种多目标损失函数计算策略用于网络训练.该框架估计出目标语音和噪声,基于此得到估计的带噪语音,然后对这三部分进行联合优化.实验结果表明,所提方法可以提高网络对噪声抑制能力,通过该策略可以获得质量更高,噪声残留更少的增强语音.
其他文献
针对DCASE2017挑战赛任务4提供的大规模弱标记声音事件检测数据集,我们搭建了基于梅尔滤波器特征(Fbank)、卷积神经网络(CNN)以及循环神经网络(RNN)的多类别声音事件检测系统,分析了 attention和lin-ear softmax两种已有的常用池化层在神经网络反向传播中的部分推演过程,并在linear softmax池化层的基础上进行改进,提出了一种“指数可学习的幂函数softmax”池化层.实验结果表明,相比于DCASE竞赛中获得第一名的模型,应用“指数可学习的幂函数softmax”池
通过预测无线信道可以解决高速移动导致的信道过时问题、或利用预测资源分配提升无线系统的资源利用率和用户体验.尽管对机器学习进行离线训练的时间较长,但利用训练后得到的模型进行在线推断时计算复杂度低,有望解决信道预测这类对实时性要求高的无线任务.联邦学习可以充分利用移动设备采集的数据和计算资源,同时保护隐私敏感的用户数据.对于隐私不敏感的无线数据,应用联邦学习的主要动机之一是相对于需上传原始训练数据的集中式学习能降低通信开销.本文考虑平均信道、瞬时信道和未来接入小区这三个预测问题,对经过模型压缩后联邦学习的上行
针对组网雷达被单点运动辐射源干扰情况下的目标检测问题,本文利用目标多角度回波在传播延时、多普勒以及散射特性上存在差异的特点,设计了一种基于干扰延时、多普勒对齐的自适应干扰抑制算法.本文首先建立了单点运动辐射源干扰条件下的组网雷达信号模型,其次对抑制算法进行了详细介绍,最后通过典型场景的仿真分析验证了所提算法的抑制效果.仿真结果说明,所提算法可以充分利用目标在距离多普勒域的稀疏特性,实现干扰的有效抑制.
探地雷达实际应用场景中介质表面往往存在着其他覆盖物,将会严重影响实际探测效果,如冬季路面表面的冰层、沥青铺路时防止沥青混合物粘在滚筒表面而喷出的水汽层等,且这些覆盖层的厚度较薄,通常小于探地雷达可分辨的最小厚度.因此,本文提出了一种基于反射信号时域重构的层状介质参数反演方法,利用广义反射系数建立雷达发射回波的时域模型,再通过遗传算法对模型的代价函数进行优化进而反演出覆盖物薄层的参数.最后,通过时域差分工具gprMax仿真软件模拟沥青混凝土实施铺路场景,对所提算法的有效性和准确性进行验证分析.
基于Abaqus软件提供的Python二次开发接口,研究复杂结构轮胎的参数化高效建模方法.建模过程如下:结合宏录制功能录制所需Python代码,修改参数后生成脚本文件,采用RSG对话框创建轮胎建模插件,输入轮胎结构关键参数后可以一键生成轮胎有限元几何模型.该方法将原来需要数小时才能完成的轮胎建模缩短为几秒钟,极大地提高复杂结构轮胎的设计效率,为后续轮胎有限元仿真分析奠定了较好的基础.该技术可以推广应用于飞机、轮船、汽车等的其他复杂结构零部件的高效建模中.
研究不同品种炭黑混炼胶在不同测试条件下的加工流变性能.结果表明:炭黑N550的混炼加工性能好,炭黑N134混炼时更易聚集,分散差;混炼胶的门尼粘度和结合橡胶含量随着炭黑结构的增高和比表面积的增大而增大,与炭黑CDBP吸油值的相关性好,相关因数均为0.95;混炼胶的Payne效应与炭黑比表面积和应力松弛面积的相关性好,相关因数均为0.98;混炼胶的挤出胀大比受混炼胶中结合橡胶和包容胶含量的双重影响.
电子战环境中,随队支援式假目标可在雷达照射主瓣内做非线性运动,这对基于相控阵体制的雷达实时地将波束零点对准假目标位置造成了困难.针对这一问题,提出一种基于频控阵雷达的动态零陷形成技术,系统通过从环境中提取干扰假目标距离信息,之后结合认知技术利用扩展卡尔曼滤波器获得假目标运动的外推轨迹,并将预测信息通过反馈回传至雷达发射模块,通过频控阵距离维波束形成技术调整发射权矢量使得波束零点指向干扰源预测位置.仿真结果表明:所提方法可以有效地实施对主瓣内运动的欺骗式假目标动态零陷,相比于不基于预测信息的波束形成技术具有
由于广播节目受众广,影响力大,其播控要求高,对错播、插播、漏播等异常播出情况容忍度低.针对广播节目播出实时监测问题,本文提出了一种快速的广播音频信号相似性检测方法.该方法计算Pearson相关系数来判别两广播音频信号是否相似.然后,为了抵消编解码器、收发设备及传输信道的影响,应用自适应Volt-erra滤波器来处理信号.最后,用子带分解技术将全频带信号分解为子带信号,并仅对功率最高的子带进行分析预处理,以降低计算量.实验结果表明,在考虑了真实的传输影响后,通过不同条件的比较,该方法具有良好的检测准确度,且
圆周扫描地基SAR(GBCSAR)是一种具备三维成像能力的地基SAR系统,其运动轨迹特殊,给三维成像带来难度.后向投影(BP)算法适用于该系统成像,但其计算量巨大,难以实现实时成像.应用于机载圆迹SAR成像的频域算法由于机载圆迹SAR与GBCSAR系统在成像模型和信号模型上都存在差异,因此无法应用于GBCSAR.因此,本文提出了一种针对GBCSAR的频域三维成像算法.本文在GBCSAR系统模型的基础上,推导信号由斜距平面转换到成像平面的解析表达,在频域进行匹配滤波,实现信号的聚焦.之后对本算法的适用条件进
研究氧化石墨烯(GO)对绿色轮胎胎面胶用复合材料[GO/天然橡胶(NR)/溶聚丁苯橡胶(SSBR)复合材料]微观结构及动静态性能的影响.结果表明:添加适量GO有利于白炭黑在橡胶基体中的分散;随着GO用量的增大,GO/NR/SSBR复合材料的定伸应力、拉伸强度和撕裂强度逐渐增大,当GO用量为4份时GO/NR/SSBR复合材料的物理性能最佳,当GO用量为2份时GO/NR/SSBR复合材料的动态力学性能最佳.