基于信号稀疏特性的语音增强算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：potato_212

【摘要】

：

语音增强是语音信号处理中的一个重要研究方向,在远程通信、助听设备、智能家电、人机交互以及智能会议系统中有着广泛的应用。语音增强算法一般利用干净信号与噪声在结构特

【作者】

：

童仁杰

【出处】

：

中国科学技术大学

【发表日期】

：

2018年期

【关键词】

：

语音增强稀疏分布麦克风阵列多通道语音增强时频分解模型离散余弦变换正交匹配追踪空时协同滤波最小均方误差张量分解正交基矩阵统计风险

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音增强是语音信号处理中的一个重要研究方向,在远程通信、助听设备、智能家电、人机交互以及智能会议系统中有着广泛的应用。语音增强算法一般利用干净信号与噪声在结构特性上的差异,采用数学方法将观测到含有噪声的语音信号变换到新的域。在这个新的域内,语音和噪声的区分性变得更加明显。具体而言,干净语音对应的系数往往是稀疏分布的,而噪声对应的系数则是随机分布的。因而只需简单的数学操作就可以实现语音和噪声的分离。然而现行的语音增强系统仍然有诸多问题没有解决。比如说,在很多算法中,噪声通常被假设为近似平稳的。这意味着与干净语音相比,噪声幅度的变化速度相对缓慢。在噪声不满足平稳性假设时,很多语音增强算法会面临性能损失,甚至会导致明显的语音失真。为此,研究者们提出将多个相同型号的麦克风按照一定形状组成麦克风阵列,进而发展出了丰富的多通道语音增强算法。此外,真实场景中往往还存在着混响和回声等,这给多通道语音增强算法带来严峻的考验。本文基于干净语音信号在不同变换域中体现的稀疏特性,提出了几种行之有效的语音增强算法,主要工作可以概括如下:首先,针对在时域呈现稀疏和非平稳特性,且在时间上随机分布、幅度任意大的冲击噪声,提出一个基于单通道的鲁棒的时频分解模型,将受噪声污染数据中的干净语音成分投影到一个离散余弦变换字典上,将冲击噪声投影到一个单位矩阵字典上。通过控制两组投影系数的稀疏度比例,并采用一种改进的正交匹配追踪算法,可以优化得到两种成分对应的稀疏投影矢量,进而实现对干净语音成分的重构。通过控制稀疏度的比例和重构误差的大小,可以控制语音失真和噪声残留之间的平衡,从而取得最佳的听觉效果。其次,针对在实际环境中存在的方向性、无方向噪声,提出对多通道音频数据流做并行化处理。采用一个固定长和宽的矩形窗口,在多通道音频流上按照一定的速度均匀滑动。在每个特定时刻,只针对窗口选取的数据矩阵的行、列作线性变换,从而实现空时协同滤波。我们采用迭代的方式分别更新时间滤波器矩阵和空间滤波器矩阵。基于最小均方误差准则,首先固定时间滤波器,更新空间滤波器;然后固定空间滤波器,更新时间滤波器;整个过程在两到三个循环即可收敛。最终,可以一次性得到对应所有通道的增强之后的语音数据。再次,为了充分利用多通道观测数据中携带的时间和空间信息,先对每个通道输出的音频数据流进行分帧,然后把这些帧重排为一个矩阵。更进一步,将对应于各通道音频流的矩阵堆叠成一个三阶张量,并设计三个滤波器(即帧内滤波器,帧间滤波器,空间滤波器),对该观测张量进行空时协同滤波。基于最小均方误差准则,采用一种循环迭代的方式交替更新三个滤波器,直到整个过程收敛。该方法可以一次性地估计得到所有通道内的干净语音数据。最后,基于上述三阶张量模型,我们提出将张量分解的方法用于多通道语音降噪。我们把含噪声的观测语音张量投影到设计好的正交基矩阵上,这包括通用基矩阵、有监督基矩阵、无监督基矩阵。通用基矩阵为三维离散余弦变换基矩阵,有监督基矩阵可以从预先提供的干净语音学习得到,无监督基矩阵则从含噪声的语音张量中自动推理获得。投影系数被包含在一个具有同样尺寸的核心张量内。根据最小化统计风险准则,可以设计出一种最佳的门限阈值;将核心张量中幅度低于该阈值的元素全部置零,即可实现噪声的抑制。

其他文献

氟喹诺酮类药物合理用药及不良反应分析

目的分析氟喹诺酮类药物不良反应发生情况与合理用药的方法。方法选取我院80例使用氟喹诺酮类药物后出现不良反应的患者的临床资料进行分析,观察不良反应与年龄、性别、药物

期刊

氟喹诺酮类药物合理用药不良反应

入世后我国零售业的八项对策

入世后我国零售业面临更复杂更激烈的国际竞争,必须从各方面采取对策:在思想认识上,要切实转变思想观念,知己知彼,明确赶超目标;在策略上,要遵循零售业发展规律,调整好各种零

期刊

入世零售业规模化特色经营科技型企业国际市场中国

克林霉素的不良反应与用药安全性

目的分析研究克林霉素的不良反应,进一步探讨如何安全用药。方法选取我院在2017年9月~2018年9月期间收治的克林霉素的不良反应患者80名,对患者的不良反应类型、特征、用药情

期刊

克林霉素不良反应安全性

论企业形象与竞争

在我国建立社会主义市场经济体制的新形势下,现代商战进入了崭新的阶段。商品信息“爆炸”,科学技术飞速发展,市场繁荣,消费者的观念及需求特征等都发生了根本的变化。人们已

期刊

企业形象需求特征现代商战市场经济体制市场繁荣物质需求市场机制企业合作公关危机视觉识别

茵栀黄汤联合双歧杆菌三联活菌治疗新生儿黄疸的疗效

目的观察新生儿黄疸应用中西医结合治疗的疗效及安全性。方法此次研究的对象是我院收治的84例新生儿黄疸患儿,并依据治疗措施不同进行分组,对照组42例给予常规治疗,观察组42

期刊

茵栀黄汤双歧杆菌三联活菌新生儿黄疸

基于GeXP多重基因表达分析系统的多重PCR检测鸡免疫抑制病病毒

引言 GeXP系统是用于多基因表达定量分析的平台,在用一PCR体系里由通用引物和特异性嵌合引物引发的多重PCR反应,采用毛细管电泳分离技术,可在同一个体系里对多达30个基因进行

会议

关于让利销售的几点思考

本文通过分析商业利润的产生、可让利的程度和毛利率、销售收入、毛利额之间的辩证关系，指出商家开展让利销售时不可滥用，应准确把握时机与商品种类，商家在制定合理商品价格前提

期刊

商业企业让利销售商品价格利润商品种类

中国连锁经营的成就、问题与对策

中国连锁经营的成就、问题与对策曾庆均一连锁经营，无疑是当今我国流通领域的一大热门话题。连锁经营是现代零售业主流，当今雄踞世界零售业高位的大公司无不实行连锁经营。连锁

期刊

中国连锁经营商品流通体制配送中心规模效益锁店连锁超市连锁企业经营方式传统商业现代大工业

民族县域旅游经济发展存在的问题及对策——以国家重点风景名胜区、4A景区为视角

民族县域旅游经济的发展对带动民族县域经济发展有着极其重要的意义。位于民族县域的国家重点风景名胜区、4A景区在很大程度上分别反映了民族县域旅游经济发展的资源品味和发

期刊

民族县域旅游经济4A景区

分析正颌联合正畸矫治唇腭裂术后牙颌面畸形患者的方法、效果

目的分析对于唇腭裂术后患者牙颌面畸形情况联合采取正颌与正畸矫治的临床效果。方法观察组患者联合采取正颌与正畸治疗,对照组患者仅采取正颌治疗。结果治疗后观察组的牙齿

期刊

唇腭裂牙颌面畸形正颌正畸矫治

基于信号稀疏特性的语音增强算法研究

与本文相关的学术论文