基于噪声追踪的二值时频掩蔽到浮值掩蔽的泛化算法

来源 :声学学报 | 被引量 : 0次 | 上传用户：motombo555

【摘要】

：

虽然浮值掩蔽比二值掩蔽有更好的语音分离效果,但是由于理想浮值掩蔽难以直接估计,现有的语音分离系统通常以理想二值掩蔽估计作为计算目标。我们提出了一个二值掩蔽到浮值掩

【作者】

：

梁山刘文举江巍

【机构】

：

中国科学院自动化研究所模式识别国家重点实验室,

【出处】

：

声学学报

【发表日期】

：

2013年05期

【关键词】

：

噪声能量语音分离算法处理信噪比增益马尔柯夫链条件随机场听觉掩蔽非平稳噪声输入信噪比语音信号

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

虽然浮值掩蔽比二值掩蔽有更好的语音分离效果,但是由于理想浮值掩蔽难以直接估计,现有的语音分离系统通常以理想二值掩蔽估计作为计算目标。我们提出了一个二值掩蔽到浮值掩蔽的泛化算法。由于实现浮值掩蔽估计的关键在于噪声能量追踪,我们首先采用指数分布刻画以混合谱和噪声能量以混合能量及二值掩蔽为观测的条件分布。其次,采用高斯马尔柯夫条件随机场刻画噪声估计在连续几帧内的关联。最后,采用马尔柯夫链-蒙特卡洛计算噪声能量最小均方误差估计并进一步计算浮值掩蔽。实验表明,相比于基于二值掩蔽估计的常规算法,我们所提出的算法在信噪比增益和客观感知质量两方面都有显著提高。 Although floating masking has better speech separation than binary masking, the existing speech separation systems often use ideal binary masking estimates as computational targets due to the difficulty of direct estimation of ideal floating masking. We propose a generalization algorithm for binary masking to floating masking. Since the key to achieving the floating-mask estimation lies in the noise energy tracking, we first use an exponential distribution to characterize the conditional distribution observed with mixed energy and binary masking with mixing spectrum and noise energy. Secondly, the Gaussian Markov random field is used to characterize the correlation of noise estimates in consecutive frames. Finally, Markov chain Monte Carlo is used to calculate the minimum mean square error of noise energy and to further calculate the floating mask. Experiments show that compared with the conventional algorithm based on binary mask estimation, our proposed algorithm has significantly improved signal-to-noise gain and objective perceived quality.

其他文献

矩阵伪逆的递归计算和程序

在系统辨识中,常常需要计算矩阵的伪逆。本文叙述了递归计算n×m(n

期刊

矩阵递归计算伪逆离散系统相邻矩阵系统辨识求逆矩阵的秩算法矩阵求逆

介绍两种气动机械手

在许多技术革新或新设备设计项目中,只在某个环节应用小巧简单的气动装置,会大大扩大气动技术的应用范围,获得良好的经济效益。下面介绍的两种气动机械手就属于小型气动系统

期刊

气动机械手晶体三极管气动装置气动系统技术革新气动技术设备设计管针工作台管芯

芬太尼伍用咪唑安定用于小儿术后静脉自控镇痛31例

目的: 观察芬太尼伍用咪唑安定用于小儿术后静脉自控镇痛的效果及不良反应.方法:62例行腹部及四肢手术的患儿,随机分为对照组和观察组,每组31例.两组均加入芬太尼10μg·kg-1

期刊

儿童自控镇痛静脉芬太尼咪唑安定

插齿机主传动六杆机构的优化设计

本文首先讨论了在插齿机主传动机构中使用的六杆机构的优化设计问题,并建立了一个多目标数学模型.然后,提出了一种利用计算机本身特点而不引入参数约束条件的直接方法,来求解

期刊

插齿机六杆机构主传动优化设计多目标优化线性加权优化设计问题极大值约束条件区间

“和兴生物”精耕细作步步为营 “皮肤健康免费试用专卖店”续写创业财富神话

品质好技术精和兴生物步步为营求发展6年前,和兴生物在山东潍坊刚刚建厂的时候,如一滴水融入大海,没有激起任何波澜,当地人甚至不知道这家企业投产。但6年后,当超过1300家“

期刊

免费试用皮肤健康专卖店财富神话投资项目滴水系列产品代理商这家吹糖人

仿真技术在冶金自动化中的应用

仿真技术已经成为冶金生产过程模型化、自动控制系统研究设计、优化生产管理模型的重要技术手段。本文综述了仿真技术在冶炼、加工、生产管理自动化方面的应用。 Simulation

期刊

仿真技术自动控制系统模型化冶金自动化管理自动化冶金生产研究设计自动化应用生产过程离散控制系统

易发久企业发展不能过分押宝于人

“时下,很多企业喜欢高薪‘挖人’。适当地采用这种方式引进人才是必要的,但不能依赖这种手段。这里说的以‘人’为本,不是传统意义上的概念,而是指那些将公司发展过分押宝在

期刊

管理方法商业思维万达万科房地产企业中国培训商业地产基业长青企业模式中国企业管理

胃肠激素酪酪肽的特性及其与疾病关系的研究进展

酪酪肽(Peptide YY,PYY)是1982年发现的一种胃肠激素,它主要由分布于回肠及结肠粘膜的内分泌细胞即L细胞分泌,是由36个氨基酸组成的肽类物质。通过对PYY的结构及功能特点研究

期刊

胃肠激素酪酪肽与疾病关系受体中枢神经系统外周神经系统分布内分泌细胞氨基酸组成细胞分泌肽类物质结肠粘膜功能特点传递信息胰多肽细胞内

控制系统传递函数的极零相消和能控性能观测性问题

本文主要讨论以电气传动系统为背景的单输入单输出线性定常系统的传递函数极零相消和能控性能观测性问题。从理论上把工程通用的框图法和状态空间方法相结合,不必列写状态方

期刊

能观测性能控性相消传递函数振型系统传递函数状态空间方法线性定常系统电气传动系统极点

漳州市2012年起医保年度调整为自然年度

漳州医保年度自2012年起统一调整为自然年度(每年1月1日至12月31日)。医保年度起止时间调整后,漳州年度结转时间与省内多数统筹区一致,避免了单独年度结转停机带来的不便,减

期刊

医保医保经办机构定点医疗机构起止时间漳州市日至医保中心参保人

基于噪声追踪的二值时频掩蔽到浮值掩蔽的泛化算法

与本文相关的学术论文