压缩域音频检索的预处理和降噪算法研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:lengningyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的高速发展,用户对文本、音视频等多媒体信息的检索也越来越频繁。对音频的检索而言,目前互联网及各种数据库中的音频数据大多以压缩格式存储,这使得如何对压缩域音频数据进行处理,并实现压缩域音频的高效检索成为音频研究领域的一大热点。   鉴于此,本论文对压缩域音频检索的相关预处理算法展开研究,首先阐述本课题的研究目的、研究意义和国内外研究现状,然后分别针对压缩域中音频信号的活性检测、音频降噪、音频特征相似度的度量和音频时间长度调整等算法进行研究。   区别于非压缩域中音频的活性检测方法,本文提出一种基于压缩域的音频检测方法。该方法采用从压缩域音频中提取短时修正的离散余弦变换(MDCT)的谱能量特征,并利用该特征参数的统计特性自适应调整判决门限。该检测方法的提出也为压缩域中音频的活性检测提供了一种思路。   另外,本论文还将正态反高斯分布(NIG)应用于音频信号处理中,给出了一种压缩域音频的自适应降噪算法。首先,验证了NIG分布拟合MDCT系数分布的有效性,然后在此基础上根据贝叶斯理论设计基于NIG模型的最大后验概率估计器。同时,利用压缩域音频的活性检测算法区分出静音段,由静音段的衰减比重调整迭代次数,实现降噪。   针对音频分类检索处理中,对音频特征进行相似度时对高度量精度的要求,本文将Renyi熵的概念应用于音频相似度量中,提出适用于音频特征矩阵间进行相似度度量的Renyi二次联合熵。并且通过实验证明了所提出方法的有效性,同时,与欧式距离度量法进行比较,验证了本文方法有更高的度量准确率和较强的噪声鲁棒性。   最后,研究并实现了音频时间长度调整算法。采用由短时均值包络到波形细化逐层匹配的方法,在很大程度上提高了音频时长调整算法的运算效率;同时,采用音频最优低能量率(MLER)特征动态调整分析窗的长度,使对混合音频也有较好的处理效果。
其他文献
随着科技的发展,虚拟听觉开始应用到生活与科研的方方面面。生活方面例如3D电影、3D游戏等。科研方面例如军事的模拟训练与视觉辅助系统的研究等。尤其是在视觉辅助系统中,虚拟
随着计算机视觉算法的发展,视觉导航技术在自主移动平台的导航与定位中得到了越来越多地应用。本文旨在研究视觉导航系统中的立体视觉里程计技术,通过对摄像机获得的双目图像
尿沉渣显微镜检查是临床检验和诊断鉴别的重要方法,采用人工镜检的传统方式存在劳动强度大,容易引入误差等缺点,而且所看到的图像无法变换、处理,难以远距离传输,也不能进行
电子侦察系统的一个重要特点是要截获大量的无线信号,将其数字化之后再进行处理,这就是软件无线电的思想。数字化之后的数据需要高速传输到计算机进行分析或存储,因而该系统
无线充电的构想由来已久,近年来针对无线充电的研究也越来越多。自从麻省理工的研究团队在两米外点亮一个60瓦的灯泡之后,无线电能传输技术的发展更是突飞猛进。如今,市面上已经出现了无线电能传输的产品,如手机、mp3、笔记本电脑充电器等,虽然这些商品实现了无线充电,但其距电能发射端几乎是零距离。此外,当前人们对无线电能传输技术的研究还大多固定在单发送和单接收的模式之上,随着电子产品的增多,对单发射多接收电
随着GPS测量技术的发展,利用载波信号精确确定载体的姿态成为GPS应用中一个新的研究方向。文章通过载波相位相对定位理论,研究了利用GPS载波信息进行二维姿态的测量理论和算法,
高光谱图像十分庞大,给存储、传输和处理带来了很多问题,因此压缩技术研究成为了当今热点。高光谱空间和谱间相关性的特点决定了压缩降维的方法应不同于普通图像。基于高光谱
随着科技的迅速发展,网络己成为人们表达见解、讨论公共事务、参与经济社会、政治生活以及进行舆论监督的重要公共平台。网民规模的逐年攀升导致网络舆情形成迅速,对社会的影
粒子滤波(Particle Filter,PF)解调算法是粒子滤波在信号处理领域中新的应用,其研究的目的是通过粒子滤波算法来实现对通信信号幅度、载波频率和相位这三个参数的估计,实现信
自Turbo码一出现,就以它接近Shannon限的优异性能引起了信息与编码理论界的轰动,得到了广泛研究及应用,被确定为第三代移动通信系统的信道编码方案之一。将信道编码技术与正