论文部分内容阅读
音频数据为多媒体数据的一种,由于存储空间和网络带宽的限制,音频编解码器被广泛应用于数字存储和数字音频通信两大领域。目前主流的音频编解码方案充分考虑了人耳感知特性,将心理声学模型引入音频编码中,获得了存储量(或码率)和音质的较好平衡。随着通信网络的不断发展,通信系统在复杂度、延迟、鲁棒性等方面对于音频编解码器提出了更高的要求本文首先介绍了常用的音频编解码器的基本原理和工作方式,回顾了近年来音频编解码器研究的主要进展,并总结了现有音频编解码器的优缺点。随后描述了现有主客观音质评价的主要方法。
论文提出可以将非均匀快速傅立叶变换(NUFFT)应用于音频编解码器中,从理论和数值模拟两个方面论证了这种应用的可行性,同时根据音频编解码器本身的特点,提出了一种NUFFT的近似逆变换,重点讨论了这种近似逆变换带来的精度损失和稳定性的改变。
针对特殊的网络传输要求,设计了一种新的可分级音频编解码器。相对于传统的可分级音频编解码器,这种新方案更加注重核心层与扩展层之间的连接,也充分考虑了误差信号本身的分布特性,从而可以得到更好的比特分配结果。