基于张量模型的语音增强算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:xu9865
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是自然界中最普遍和便捷的交流方式之一,同时也是一种重要的信息传递手段。可是,在实际的环境中,背景噪声和干扰的存在不仅降低了语音的可懂度,有时甚至会丢失语音的部分信息,从而会对后续的应用带来一系列的挑战,例如会议转写记录系统,语音编码和自动语音识别等。因此,在嘈杂的实际环境中,语音增强这一课题的研究就显得极其重要,这也是语音信号处理中很重要的一个预处理环节。语音增强指的是当语音信号受到噪声或者干扰影响时,在保证语音信号尽可能完整的前提下最大程度的抑制或者削弱噪声和干扰,即从接收到的混合带噪语音信号中获取尽可能纯净的语音信息,从而提高这些受污染语音信号的质量以及可懂度。根据麦克风数目,可以将语音增强算法分为单通道和多通道语音增强两大类。传统的单通道语音增强系统因相对容易实现并且有一定降噪效果,在工程实际中被广泛应用。但当噪声或者干扰较大时,单通道系统可能会引入“音乐噪声”或者导致语音失真。而对于多通道语音增强算法而言,除了可以获取麦克风阵列接收语音信号的时域-频域信息,同时可以利用多麦克风信号的空间信息,从而取得更优的降噪效果。大多数现有的多麦克风降噪算法都是直接利用接收到的带噪语音信号的频域-空域或者时域-空域的相关性。然而,很少有关注频域-空域-时域三维联合的相关性。在本文中,提出将接收到的多麦克风语音信号表示为三维张量形式,联合利用语音信号时域-空域-频域的多维信息将信号建模成一个三维张量。接着,通过交替最小二乘法等张量分析工具建立多模滤波器,设计时域、频域与空域滤波器组对接收的含噪语音信号依次进行滤波操作,对噪声进行抑制,得到相对纯净的多通道语音信号。为了提高多维滤波算法的性能,进一步把该方法和传统的波束形成算法相结合。先在高阶张量框架下对输入的带噪信号进行降噪预处理,以较好地消除背景噪声。其次,将获得的预降噪的多通道语音信号再通过波束形成算法,进一步消除有方向性的干扰。这两种方法的结合不仅对麦克风的自噪声等非方向性噪声有很好的抑制效果,同时可以很好地抑制方向性干扰,更符合真实使用场景。在仿真环境和真实声学系统下测试了上述所提出的框架,分别在主客观评价指标下进行了性能比较。实验结果表明,所提出的框架在主观和客观评价指标下均取得较好的指标。
其他文献
<正>一个完善的退休规划,使你在白发苍苍的日子里仍然感受花样年华随着人类平均寿命越来越长,长寿可能会变成生命中的一种风险。因为寿命越长,越需要足够的财富,否则晚年难享
当前,高职院校的平面广告设计课程普遍存在缺少新媒体媒介支持、与社会需求脱节、不适应学生学习特性等问题,这就使得学生相关专业能力与社会岗位需求存在一定差距.为保证人
在广告学专业教学过程中,教学模式是十分重要的,尤其是广告学专业教学理论体系的完善与学生学习效率提高方面的结合。学校教师应该切实考虑自己的专业教学能力和方法,充分利
根据合成的能量条件,建立了焊合形成的能量判据,得出模具与铝铸件真实接触面积与表观接触面积的比值是影响焊合形成的关键因素。建立了模具与铝铸件真实接触面积与表观接触面积
我国正面临着日益严峻的资源短缺形势,资源的稀缺性要求建设资源节约型社会。目前高等教育资源的严重不足,影响高等教育教学质量,制约着高校的发展。提高教育资源利用率,降低
<正>仅仅用5年时间,华融即由亏损国企变身为中国规模最大的资产管理公司——依法治企无疑是实现其中关键一跃的核心引擎。当依法治国成为新时代强音的时候,民主科学的决策体
番石榴果实经过45℃5分钟、45℃10分钟、50℃5分钟和50℃10分钟等4种温汤处理后于常温贮藏,定期检测比较其生理生化指标及观察果实品相。结果表明,50℃温汤5分钟处理对抑制番
目的:查找10年来马钱子制剂治疗类风湿关节炎的研究进展。方法:应用计算机检索CNKI期刊数据库,检索词为马钱子制剂、类风湿、关节炎、综述。对资料进行初筛,并查看每篇文章后
2017年,农业银行宁夏分行全年1/3党委会用于研究党建工作,每季3次专题会部署党建工作。本人以身作则,参加支部学习13次、讲党课4次。实行“责任清单”工作法,制定11张个性化清单,
报纸
通过混合式教学模式在《现代广告学》教学中的改革与实践,衡量其所产生的教学效果,主要表现为三个方面:教学内容得以优化;学生综合能力得到提升;教学团队进一步凝练.最终对《