听觉心理声学模型及其在感知音频编码中的应用

来源 :东南大学 | 被引量 : 0次 | 上传用户:xianglikai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文首先描述了掩蔽效应,探讨了多种感知音频编码标准的原理与算法,重点讨论了MPEG音频编码标准的发展过程与特点.有两种心理声学模型-模型1和模型2,论文结合MPEG-1等级Ⅰ音频编码标准对心理声学模型1进行了分析.心理声学模型2较模型1更为复杂.论文分析了心理声学模型2的算法流程.频谱分量按照固定划分的比例因子频带进行量化,心理声学模型决定了每个比例因子频带的量化步阶,没有明确的比特分配,而是为每一个比例因子频带计算出等于估计掩蔽阈的允许噪声量,比例因子完成量化噪声的整形.量化后的系数进行霍夫曼编码.论文中用两层嵌套迭代循环来控制整个过程.借助于上述工作,软件实现了MPEG-2 AAC的低复杂度框架,在码率和质量上均获得了满意的结果.目前,新一代MPEG-4音频标准已经公布,论文对这一标准作了介绍.
其他文献
学位
在网络技术迅猛发展的今天,越来越多的新科技伴随着人们的追求应运而生,与家庭生活息息相关的智能家居成为了当前的热门话题。智能家居系统通过网络技术对家庭中各种各样的信
随着成像光谱遥感技术的飞速发展,成像光谱图像(spectral imagery)已经在军事、农业、林业、地质、矿产、水文、水资源和海洋等各领域得到了广泛应用。成像光谱图像在提供更为
该文主要研究宽带网络生存性的一些重要问题.在介绍背景知识和回顾现有技术的基础上,该文首先对分布式自愈技术进行了较为深入的研究,并提出了三个算法.第一个算法是基于消息
该文介绍了一个Internet上的数据广播分发的模型,在这个模型中,研究人员不是将多点的数据传递作为一个网络原语实现(如IP多播所作的那样),而是将它置于应用级的网络基础结构
现代化国防建设对微弱机动目标检测及其运动参数估计提出了更高的要求。增加相参积累时间是提高雷达目标检测性能和参数估计精度的有效方法之一。然而,在长的积累时间下,目标
该文主要研究了图象形态学在图象编码中的应用,重点是基于终极腐蚀的二值图象编码方法(中心扩展法),提出了新的非骨架点判定定理,并提出了非终极腐蚀的概念和判定定理;提出一
长期以来面向实用化的话者识别系统的研究在国际及国内都受到了极大的关注和重视.该文以实用为目标,从系统结构简单、用户注册和使用方便着手,采用基于短语音(两个音节的汉语
该文一共分七个章节进行阐述.先简单介绍一下SNMP的发展、基本概念、特点,接着对管理的对象系统ADSL系统结构作了描述,然后提出了分布式管理的模型,开发的软件平台及开发过程
从20世纪70年代商用光纤通信通信问世以来,它在人们的生活中扮演中至关重要的作用,接入网是整个光纤通信系统中的重要组成部分,其中radio over fiber (RoF)和无源光网络(PON)