音频样例检索技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:caiwenta
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
步入21世纪以来,通信技术、互联网技术和多媒体技术得到了迅猛的发展,信息数据中的多媒体数据量已经大大超过了文本数据量,并且仍然保持着高速增长。音频、视频和图像是多媒体信息的主要部分,为了使音频信息得到充分的利用,人们开始关注音频信息检索技术。相对于图像和视频,音频数据具有非结构化的特点,这一特点使得音频信息检索比图像和视频信息检索更加困难。音频信息从存在形式上来讲有两种,一种是存储在某种介质之中的,比如光盘或者磁带,另一种是实时播放的,比如广播。这造成了音频检索的离线和在线之分。另外音频检索还可以分为表示级和语义级。因此检索不同的音频形态需要不同的检索方法。音频信息检索技术发展的时间并不是很长,目前还存在许多问题需要解决。从整体上来说,实用的检索系统还非常的少,音频检索技术研究还是处于刚刚起步阶段。本文主要研究表示级音频检索,针对音频样例检索方面,开展了以下研究工作:1、对于音频样例检索的噪声敏感问题,提出了基于阈值自适应的直方图音频检索方法。在音频特征矢量量化中,根据音频特征的特性优化了矢量量化码书产生方法。分析了动态直方图在噪声情况下的缺陷,结合特征编码匹配进行检索阈值的自适应控制。实验结果表明,该方法具有较好的噪声鲁棒性。2、对于音频检索的残缺鲁棒性问题,提出了划分子模板的检索方法。该方法将参考音频分为若干子模板,并使用子模板登记到滑动窗内来控制其是否进行检索。结合实验分析了目标音频各部位发生残缺对算法的影响,最后对比整体检索方法证明了该方法的残缺鲁棒性。
其他文献
本课题针对固定区域内的飞机以最短时间为目标,完成一个批次飞机的起飞调运任务,深入研究了飞机调运路径规划和并行起飞调度方法,满足飞机运动约束条件,同时实现了不同起飞位
等价性研究一直是混杂系统分析验证领域热门的研究方向之一。微分半代数混杂系统是一种较为复杂的混杂系统,在描述和验证分析带有微分数据流特征的混杂系统中有广泛的应用前景
针对重复或周期作业的被控对象,学习控制技术通过重复修正输入,使得被控系统的实际输出轨迹在有限时间区间或在整个周期上实现关于期望输出轨迹的零误差跟踪,并且确定性或周
1394接口是始于苹果公司和德州仪器公司的一种高速串行接口标准,苹果公司称之为FireWire(火线),索尼公司称之为i.Link。1394规范作为一种数据传输的标准,该标准具有高速、灵
随着计算机技术、超大规模集成电路、控制理论、人工智能理论、传感器技术等的不断成熟和发展,各种机器人系统在工业制造、军事侦察、核工业、航空航天、服务业、医疗器械等
点云拼接技术作为处理点云的关键步骤,在逆向工程、虚拟现实、文物保护、机器人视觉和医疗技术等诸多领域得到了应用,但其在逆向工程中应用最为广泛,它对点云曲面的重建起着重要
盲信号分离是盲信号处理的一个重要研究课题。在不知道源信号特性,也不知道信号在传输通道中的混合过程,只是假设源信号是相互统计独立的情况下,从传感器阵列接收到的观测信号中
给出周期系数Riccati型方程dx/dt=A(t)x2m-1+B(t)x2k-1+c(t),(其中,A(t),B(t),C(t)是周期为T的连续函数,m,k∈N,m>k)存在周期解的充分条件。
电池荷电状态(State of Charge,SOC)用于表示电池的剩余电量多少,是电动车电池管理系统中重要的参数,影响着电动汽车整车系统的控制策略,因此SOC的估计对电动汽车的发展具有
平板显示器件VFD(Vacuum Fluorescent Display)是一种可靠性高、寿命长、应用广泛的自身发光显示器件,其寿命可达数万小时。为了在较短的时间内预测VFD在正常温度应力下的寿命