基于噪声追踪的二值时频掩蔽到浮值掩蔽的泛化算法

来源 :声学学报 | 被引量 : 0次 | 上传用户:motombo555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
虽然浮值掩蔽比二值掩蔽有更好的语音分离效果,但是由于理想浮值掩蔽难以直接估计,现有的语音分离系统通常以理想二值掩蔽估计作为计算目标。我们提出了一个二值掩蔽到浮值掩蔽的泛化算法。由于实现浮值掩蔽估计的关键在于噪声能量追踪,我们首先采用指数分布刻画以混合谱和噪声能量以混合能量及二值掩蔽为观测的条件分布。其次,采用高斯马尔柯夫条件随机场刻画噪声估计在连续几帧内的关联。最后,采用马尔柯夫链-蒙特卡洛计算噪声能量最小均方误差估计并进一步计算浮值掩蔽。实验表明,相比于基于二值掩蔽估计的常规算法,我们所提出的算法在信噪比增益和客观感知质量两方面都有显著提高。 Although floating masking has better speech separation than binary masking, the existing speech separation systems often use ideal binary masking estimates as computational targets due to the difficulty of direct estimation of ideal floating masking. We propose a generalization algorithm for binary masking to floating masking. Since the key to achieving the floating-mask estimation lies in the noise energy tracking, we first use an exponential distribution to characterize the conditional distribution observed with mixed energy and binary masking with mixing spectrum and noise energy. Secondly, the Gaussian Markov random field is used to characterize the correlation of noise estimates in consecutive frames. Finally, Markov chain Monte Carlo is used to calculate the minimum mean square error of noise energy and to further calculate the floating mask. Experiments show that compared with the conventional algorithm based on binary mask estimation, our proposed algorithm has significantly improved signal-to-noise gain and objective perceived quality.
其他文献
在系统辨识中,常常需要计算矩阵的伪逆。本文叙述了递归计算n×m(n
在许多技术革新或新设备设计项目中,只在某个环节应用小巧简单的气动装置,会大大扩大气动技术的应用范围,获得良好的经济效益。下面介绍的两种气动机械手就属于小型气动系统
目的: 观察芬太尼伍用咪唑安定用于小儿术后静脉自控镇痛的效果及不良反应.方法:62例行腹部及四肢手术的患儿,随机分为对照组和观察组,每组31例.两组均加入芬太尼10μg·kg-1
本文首先讨论了在插齿机主传动机构中使用的六杆机构的优化设计问题,并建立了一个多目标数学模型.然后,提出了一种利用计算机本身特点而不引入参数约束条件的直接方法,来求解
品质好技术精和兴生物步步为营求发展6年前,和兴生物在山东潍坊刚刚建厂的时候,如一滴水融入大海,没有激起任何波澜,当地人甚至不知道这家企业投产。但6年后,当超过1300家“
仿真技术已经成为冶金生产过程模型化、自动控制系统研究设计、优化生产管理模型的重要技术手段。本文综述了仿真技术在冶炼、加工、生产管理自动化方面的应用。 Simulation
“时下,很多企业喜欢高薪‘挖人’。适当地采用这种方式引进人才是必要的,但不能依赖这种手段。这里说的以‘人’为本,不是传统意义上的概念,而是指那些将公司发展过分押宝在
酪酪肽(Peptide YY,PYY)是1982年发现的一种胃肠激素,它主要由分布于回肠及结肠粘膜的内分泌细胞即L细胞分泌,是由36个氨基酸组成的肽类物质。通过对PYY的结构及功能特点研究
本文主要讨论以电气传动系统为背景的单输入单输出线性定常系统的传递函数极零相消和能控性能观测性问题。从理论上把工程通用的框图法和状态空间方法相结合,不必列写状态方
漳州医保年度自2012年起统一调整为自然年度(每年1月1日至12月31日)。医保年度起止时间调整后,漳州年度结转时间与省内多数统筹区一致,避免了单独年度结转停机带来的不便,减