复杂音频的事件检测与分类中的关键问题研究

被引量 : 16次 | 上传用户：guo20

【摘要】

：

音频信息作为一种人类感知和交流的重要信息形态,在人们的日常生活中发挥着越来越重要的作用,音频信息在应用中很大程度上依赖于音频检测与分类技术。本文围绕复杂音频的检测

【作者】

：

冷严

【发表日期】

：

2012年01期

【关键词】

：

音频检测音频分类主动学习半监督学习时域交叠

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

音频信息作为一种人类感知和交流的重要信息形态,在人们的日常生活中发挥着越来越重要的作用,音频信息在应用中很大程度上依赖于音频检测与分类技术。本文围绕复杂音频的检测与分类,对以下两个关键问题展开研究：训练样本标注代价昂贵、检测分类策略的设计,具体的工作和创新点包括：1)提出了一种基于BIC的主动学习初始样本集选择算法为了解决训练样本的标注代价昂贵问题,本文采用主动学习来减少人工标注的工作量。初始样本集的选择对主动学习的收敛速度有重要影响,现有的初始样本集选择算法在用于小概率事件检测时,会由于采不到小概率事件的样本,或者是采到的很少而使主动学习算法失效或是性能很差,为解决这个问题,本文从代表性和覆盖性两方面出发,提出了一种基于贝叶斯信息准则(Bayesian Information Criterion,BIC)的主动学习初始样本集选择算法。实验表明,该算法不但对小概率事件检测是有效的,而且对非小概率事件的检测也表现出很明显的优势。2)提出了结合间隔信息和误识特性共同采样的支持向量机主动学习算法在支持向量机主动学习算法中,选取离当前分类面最近的样本进行人工标注是最经典的方法,本文称之为基于间隔采样的支持向量机主动学习,但是在当前分类面偏离真实分类面较远时,则距离当前分类面最近的样本的信息含量小,此时,只根据样本离当前分类而的距离进行采样并不是最佳方案。考虑到类边界上的样本更容易被误识,在间隔信息的基础上加入误识特性进行采样将有利于提高真实边界支持向量的采集概率,为此,本文提出了结合间隔和误识特性采样的支持向量机主动学习算法,在每轮迭代中选择当前分类面附近的容易被误识的样本进行人工标注。实验表明,该算法能进一步减少人工标注的工作量。3)提出了一种结合主动学习和半监督学习的音频事件检测算法支持向量机主动学习算法通常是通过各种准则寻找边界样本,而忽略了对剩余其它样本的利用。本文考虑到类中心与类边界的相对关系,试图通过类中心更好地体现类边界,因此在用主动学习寻找边界样本的同时,通过半监督学习从剩余样本中寻找类中心样本。实验表明,本文提出的结合主动学习和半监督学习进行音频事件检测的算法与单纯的主动学习算法相比,能进一步减少人工标注的工作量。4)提出了一种复杂音频文档的音频事件分类策略复杂音频文档中,不同的音频事件在时域上会有交叠,导致用当前的音频事件分类技术对复杂音频进行事件分类时,其分类性能较差。本文以影视音频文档为研究对象来探讨复杂音频文档的事件分类问题,尤其是对交叠音频事件的分类,提出了结合纯净的音频事件模型和聚类信息进行分类的算法,该算法通过挖掘纯净音频事件样本和交叠音频事件样本的先验分布信息来提高交叠音频事件样本被分类为其所包含的某一音频事件的概率。实验表明,该算法不但能有效地提高对交叠音频事件样本的分类性能,而且对纯净音频事件样本的分类性能也有所提高,能达到整体分类性能的提高,从而可以作为对复杂音频文档进行音频事件分类的一种有效方案。

其他文献

山东邹县发现一件吴王夫差剑

1991年4月,邹县城关镇朱山庄村村民在村西北整修地堰时发现一件铜剑,后送交到邹县文物保管所。朱山庄位于县城东北3公里处,村西北为朱山,海拔207米。铜剑出土地点在山西侧的

期刊

吴王夫差剑鲁哀公

2株非酵母属酵母对酿造菠萝酒和番木瓜酒风味的影响

为了有效改进热带水果酿酒后存在的香气不足、风味远不如原果丰满的技术瓶颈问题,本文探索了两株分离自番木瓜果皮的非酵母属酵母Metschnikowia agaves P3-3、Candida tropic

学位

菠萝酒番木瓜酒非酵母属酵母混合发酵梅奇酵母热带假丝酵母电子舌分析香气成分

扭曲与见证

“身体”在20世纪已不再仅仅作为生理上的肉体的存在,而是前所未有的成为了各种权力渗入和追逐的目标。“身体”已是一个文化的概念,它甚至成为对一种价值观念不断进行编码的

学位

身体诗歌知识分子写作时间城市欲望死亡

日韩对达成垄断协议行为的处罚规定及其对中国的启示

我国《反垄断法》对达成垄断协议行为的处罚规定与世界其他国家相比,其不同之处在于,除规定了行政罚款外,还规定了没收违法所得。但是,无论是针对行政罚款还是没收违法所得,

期刊

反垄断法垄断协议行政处罚没收违法所得

我国旅游饭店立法存在的问题及其对策研究

本文结合我国旅游饭店立法的现状,从旅游业的几个基本要素的角度入手,分析我国旅游饭店立法的相对滞后给旅游业带来的不利影响,进而提出解决的措施,以促进我国旅游饭店业的健

期刊

旅游饭店立法滞后影响对策

超声技术在胃肠动力检测中的应用

超声技术在胃肠运动功能检测方面由于具有非侵入性、无放射性和应用广泛等优点，困此发展非常迅速，应用范围明显扩大，不仅可用于胃排空的测定，还能用于近端胃顺应性、胃窦收缩活

期刊

超声胃肠道动力

多元智力理论与英语学习策略使用倾向性的相关性实证研究

本研究以178名非英语专业大学生为研究对象,从多元智力理论的角度,利用多元回归分析建立回归模型,阐释多元智力和英语学习策略使用倾向性的相关性,勾勒出多元智力与英语学习

期刊

多元智力理论语言学习策略相关性

尿道悬吊术吊带材料的研究进展

目前临床侵入性治疗压力性尿失禁存在多种手术方式,文献对无张力阴道吊带术及其繁多的植入材料报道甚多。文章就目前流行的控尿机制、吊带术历史和临床使用吊带材料的最新进

期刊

尿失禁压力性吊带术阴道吊带吊带材料

心脑宁胶囊对血管性痴呆大鼠认知功能及海马区Aβ和Tau蛋白表达的影响

目的观察心脑宁胶囊对血管性痴呆(VD)大鼠认知功能及海马区β淀粉样蛋白(β-amyloid peptide,Aβ)和Tau蛋白表达情况的影响,探讨心脑宁胶囊的脑保护作用。方法采用双侧颈总动

期刊

心脑宁胶囊血管性痴呆海马β淀粉样蛋白Tau蛋白大鼠

频次效应对多词动词习得的影响研究

词块与频次研究都是二语习得领域的研究热点,但将两者结合的研究较为鲜见。本研究旨在考察频次对词块习得的影响,其中频次指的是重复接触目标词块的次数,词块以多词动词为例

期刊

频次效应词块多词动词

复杂音频的事件检测与分类中的关键问题研究

其他学术论文