基于内容的MP3音频分类研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:sh_xq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音频信息检索技术是多媒体信息检索技术中的一个重要组成部分,而音频分类技术作为音频检索技术的基础,也越来越被受到关注。基于内容的音频分类是一个涵盖十分广泛的研究领域,为了使计算机能够像人那样对音频语义实现自动理解,这个领域的研究从初始对原始音频流分析向目前感知理解发展,从实际认识向抽象理解发展,因为人脑对事物的理解是抽象的,是基于知识的。 目前,已经有很多学者对基于内容的压缩音频分类方法进行了研究,但已有方法普遍存在一些不足之处,如对人耳的听觉特性考虑较少,没有较好地利用音频压缩编码过程中的计算结果等等。到目前为止,还没有一个既能实现高正确率、又能实现高效率的同时针对纯音乐音频和非纯音乐音频的分类算法。 本文设计了一种在压缩域上对音频进行基于内容的分类系统,并对系统的分层结构和系统各个模块的实现方法和原理进行了深入的分析和探讨。 本文所采用的方案的优势在于,充分利用了编码器的计算结果,充分考虑了人耳的听觉特性,还使用了心理声学的研究成果。 另外,本文还对从压缩音频中提取参数的含义做了较透彻的分析。并通过实验结果检验了方法的有效性,在理论和实践两方面验证了方法的正确性和可行性。
其他文献
随着近年来计算机网络的迅猛发展,越来越多的用户加入到因特网中。然而不幸的是,恶意的网络攻击行为也是层出不穷,给用户造成了很大的损失。网络安全问题逐渐引起人们的重视,入侵
近年来,随着Internet的迅速普及,产生了许多新的应用,其中不少是高带宽的多媒体应用,譬如网络视频会议、网络音频/视频广播。这就带来了带宽的急剧消耗和网络拥挤问题。为了缓解
车载网是一种在车辆之间、车辆和路边设施之间建立自组织网络的技术,使得车辆在没有网络基础设施支持的情况下也能进行通信。作为智能交通系统解决方案中的关键环节,车载网在
本文主要研究的是J2EE模型在企业应用集成中的应用以及目前企业应用集成中种种问题的合理的改进方案。首先以企业应用集成为中心,介绍企业应用集成的分类,然后通过对现今企业应
随着GSM移动通信网络的发展,无线资源日益紧张,各地移动运营商都在进行不断的网络扩容,然而扩容导致的质量问题,城市高层建筑和玻璃墙对无线信号的影响问题,还有用户数量变化、频
无线自组织网络是一种特殊类型的无线网络,和传统的移动无线网络不同,它们不需要任何固定的网络基础设施。事实上,节点之间是依靠网络中的其它节点来保持网络连通的。无线自组织
J2EE 多层结构推出以来,软件业发生巨大变化,但是J2EE 只提出了广泛意义上的设计开发框架,针对各个行业的具体应用,还需要有从大量实战经验中提炼的、稳定的、健壮的、基于J2
Bent函数是一类具有最高非线性度的布尔函数,布尔函数是对称加密密码体制设计和分析的关键。本文所研究的Bent函数,对于构造一类具有高非线性度的布尔函数在密码体制的应用具
近年来P2P技术的大量运用,使整个互联网的网络流量急剧增加。P2P作为一种新型应用,一方面带来了新媒体、新视讯等新产业,另一方面又成为了一个带宽吞噬者,严重地消耗了网络带宽,阻
未来高性能计算机的发展趋势是在单个计算节点之内使用多个加速部件,更为复杂的体系结构使得通信效率成为了获得更高性能的主要因素之一。因此本文基于通信优化这一关键问题,