基于内容的音频检索技术研究与实现

来源 :西北大学 | 被引量 : 0次 | 上传用户:lisson000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何有效地对海量数据尤其是诸如音频之类的多媒体数据进行分析、存储和检索是一个亟待解决的问题。由于原始音频数据的非结构化特性,音频检索受到极大的限制。相对于日益成熟的图像与视频检索,音频检索相对滞后。基于内容的音频检索已成为多媒体检索技术的研究热点。本文对基于内容的音频检索的关键技术展开分析,主要在以下几个方面开展了工作: 1、音频信号特征提取与表达。音频检索是多特征组合检索,对音频信号的感知特征如响度、亮度、音调等;物理特征如过零率、Mel倒谱系数、线性预测系数等进行了分析,不同的特征组合应用于不同类型的音频检索。 2、音频分割与识别。将音频分层分割算法改进为基于模板的音频分割算法,利用隐马尔可夫模型的良好的随机时序性以及不依赖于具体的应用阈值的优势,使分割识别准确率有较大提高。随着MPEG压缩格式成为多媒体编码主流,研究了直接对MP3格式的音频信号提取特征,基于MPEG压缩域特征音频分割。 3、基于内容的音频检索。从音频示例查询的角度,针对不同的音频例子表示方法,分别研究了基于隐马尔可夫模型分类模板的音频例子检索算法,和基于模糊聚类音频例子检索算法。针对音乐(歌曲)检索独有特性,研究了基于哼唱的音乐(歌曲)检索,实验证明,此算法有一定的准确性。 本文设计实现了一个基于内容的音频检索原型系统,是具有良好扩展性的系统,实现了高速、有效的音频检索。最后对基于内容的音频检索系统的发展趋势研究热点进行了展望。
其他文献
随着软件工程体系的不断规范化和标准化,对软件质量的要求也越来越高。与此同时,软件测试作为软件开发生命周期中不可缺少的一个阶段也越来越受到重视,并形成了完整的测试技
在分布式通讯网络日益普及和发展的今天,任何两台相距遥远的计算机都可利用公众网络共享各种资源。但是这种数据的传输与交流给人们带来极大方便的同时,也提出一个问题:如何进行
学位
随着网络通信技术,多媒体技术,数据库技术的迅猛发展,多媒体信息急剧增长。而其中的数字图像信息应用日益广泛,并成为最主要的信息资源之一。在图像信息快速膨胀的今天,如何
在数据网络领域,IP网络技术正在演进,作为原有宽带通信网和新技术的ATM则由于技术难度大、路由灵活性较低以及效率不高等面临很大挑战,如何使ATM技术融入IP,如何将路由和交换相结
无线传感器网络综合了传感器技术、嵌入式计算技术、分布式信息处理技术和无线通信技术,能够协作地完成实时监测、感知和采集监测对象的信息,并对其进行处理,传送到需要信息的用
磁分离酶免疫分析测试仪主要用于对人体内分泌激素进行检测,根据激素指标的差异,为医生确定病人病情提供科学依据。目前,酶免仪已经成为医疗机构进行临床诊断所必需的医疗仪器之
当前众多的基于OSI的大型异构管理网络中,网管信息分散于各代理的MIB中,由于底层网络管理协议不同,这些网管信息的表现形式也不同,在传统的网络管理模式中没有统一的语义来解
在离散事件动态系统的研究中,逻辑层次的建模与控制是一个很重要的方面。由于Petri网的一些特点,例如真并发的语义、易于转换为计算机程序控制码、逻辑电路形式的硬件实现,因此
数据库知识发现(Knowledge Discovery in Databases,简称KDD)是当前涉及人工智能和数据库等学科的一门相当活跃的研究领域,序列模式发现是其中的一个重要研究方向。当前序列