基于稀疏表示的音频修复算法研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:w11122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实生活中,音频常常会因为环境噪声、网络拥塞和设备限幅等影响,而产生诸如脉冲干扰、片段丢失和削顶失真等情况的受损,降低音频的可听度和可懂度。如果音频应用于语音识别、说话人辨识等情况,还会导致相应识别率下降,所以需要对受损音频进行数字化修复,还原出受损部分,改善音频质量。针对目前音频修复的研究现状,本文采用基于稀疏表示的音频修复算法。基于稀疏表示的音频修复是指在音频为稀疏信号的前提下,利用受损音频中可靠部分的数据,在过完备字典中进行稀疏表示,然后用稀疏重建的方法来恢复出受损部分。因为音频中相邻帧之间信息存在着冗余,丢失的部分信息可以利用周围冗余信息来补全。算法分为过完备字典构造和稀疏表示两个环节。本文在前人工作的基础上,针对这两个环节进行了研究改进:1.过完备字典训练算法对于过完备字典构造,在之前的文献中采用固定字典,但是音频种类繁多,不同的音频具有不同的基频和共振峰等特征信息,因此固定字典不能很好的反映出特定音频的结构化特征,针对这一问题,本文采用训练的方法得到自适应字典,在选择字典训练算法时,为了兼顾算法的高效性和字典中原子的相关性,本文选用解耦合的K-SVD字典训练算法,即INK-SVD算法,来对音频进行训练。2.稀疏表示算法对于稀疏表示,在之前的文献中多使用OMP算法,这种算法不会选择重复的原子,稀疏表示误差小,但是,该算法并没有充分利用音频帧之间的相关性信息,即帧之间是存在很大程度上冗余的,本文通过实验的方法,证明相关性的存在,为了利用相关性信息,本文对传统的OMP算法进行改进,在选取原子的时候,考虑到该原子是否在前一帧用过,如果该原子被前一帧选中,则在下一帧中适当增加一个权重,权重的大小根据帧之间相关性动态调整,从而提高原子选取的精确性,降低计算误差的影响。本文实验部分是在Audio Inpainting Toolbox提供的音频数据集上,使用改进型基于OMP的音频修复算法对片段缺失、脉冲干扰、削顶失真等三类不同的受损情况,与传统的固定Gabor字典相比,改进算法在信噪比SNR有4-6dB提升,在主观评价指标PESQ上有0.2-0.3提升。
其他文献
为了引进新的服务类型,各国都在积极进行导航信号体制的研究和设计。L频段卫星导航信号的严重拥挤,使得新服务的引进将面临严峻的兼容性问题。为此本文重点研究并总结了L频段
未来无线通信发展的一个重要方面是其在专业领域和特殊环境下的应用研究。而其中一个需要关注的内容就是高速移动环境下的宽带无线视频通信系统。   有关这方面研究的两个
阵列雷达作为现代战场的必要装备,其研究、发展受到了广泛的关注。相控阵雷达允许波束高速捷变,因此搜索、跟踪任务可以同时进行。而在这一过程中不可避免的会出现不同任务对
空芯光纤在激光能量传输、红外热像传输和检测等方面有很好的应用和发展前景。它具有红外传输损耗小、结构简单、易于制造、柔韧性好等显著的优点。空芯光纤根据其内部材料和
空芯光纤作为一种有发展前景的红外传输光纤,具有易于制造,结构简单,柔韧性好,红外传输损耗小等显著的优点。空芯光纤根据内部结构和材料的不同可以分为全反射型及泄漏型两种
随着移动通信的发展,有限的频谱资源是限制系统性能提高的主要因素,如何尽可能地提高频谱效率是长期以来的研究热点。尤其是伴随WiMAX等宽带无线接入技术的不断发展与成熟,HSDPA
信号参数估计是信号处理研究领域的重要内容,其不仅是军事信息化不可缺少的一环,也关乎到通信、定位、地震监测等民用科技的各个层面。在日益复杂的电磁环境中,要更有效的利
本文设计了一款以ARM技术、CAN总线技术和以太网技术为核心技术的协议转换器,用于实现对计量泵的远程控制。首先在明确国内外研究现状以及系统功能需求上,分析了现场总线发展
智能车辆视觉导航系统是智能交通系统的重要组成部分,道路检测是车辆视觉导航中的关键技术,其效果受到噪声质量和成像质量的影响。智能车辆要实现在城市繁忙道路上完全无人驾
随着高清视频应用的快速发展,视频传输和储存方面产生了巨大的挑战。在这一新环境下,Joint Collaborative Team on Video Coding(JCT-VC)工作小组制定了新的视频编码标准High