论文部分内容阅读
音频信息作为一种人类感知和交流的重要信息形态,在人们的日常生活中发挥着越来越重要的作用,音频信息在应用中很大程度上依赖于音频检测与分类技术。本文围绕复杂音频的检测与分类,对以下两个关键问题展开研究:训练样本标注代价昂贵、检测分类策略的设计,具体的工作和创新点包括:1)提出了一种基于BIC的主动学习初始样本集选择算法为了解决训练样本的标注代价昂贵问题,本文采用主动学习来减少人工标注的工作量。初始样本集的选择对主动学习的收敛速度有重要影响,现有的初始样本集选择算法在用于小概率事件检测时,会由于采不到小概率事件的样本,或者是采到的很少而使主动学习算法失效或是性能很差,为解决这个问题,本文从代表性和覆盖性两方面出发,提出了一种基于贝叶斯信息准则(Bayesian Information Criterion,BIC)的主动学习初始样本集选择算法。实验表明,该算法不但对小概率事件检测是有效的,而且对非小概率事件的检测也表现出很明显的优势。2)提出了结合间隔信息和误识特性共同采样的支持向量机主动学习算法在支持向量机主动学习算法中,选取离当前分类面最近的样本进行人工标注是最经典的方法,本文称之为基于间隔采样的支持向量机主动学习,但是在当前分类面偏离真实分类面较远时,则距离当前分类面最近的样本的信息含量小,此时,只根据样本离当前分类而的距离进行采样并不是最佳方案。考虑到类边界上的样本更容易被误识,在间隔信息的基础上加入误识特性进行采样将有利于提高真实边界支持向量的采集概率,为此,本文提出了结合间隔和误识特性采样的支持向量机主动学习算法,在每轮迭代中选择当前分类面附近的容易被误识的样本进行人工标注。实验表明,该算法能进一步减少人工标注的工作量。3)提出了一种结合主动学习和半监督学习的音频事件检测算法支持向量机主动学习算法通常是通过各种准则寻找边界样本,而忽略了对剩余其它样本的利用。本文考虑到类中心与类边界的相对关系,试图通过类中心更好地体现类边界,因此在用主动学习寻找边界样本的同时,通过半监督学习从剩余样本中寻找类中心样本。实验表明,本文提出的结合主动学习和半监督学习进行音频事件检测的算法与单纯的主动学习算法相比,能进一步减少人工标注的工作量。4)提出了一种复杂音频文档的音频事件分类策略复杂音频文档中,不同的音频事件在时域上会有交叠,导致用当前的音频事件分类技术对复杂音频进行事件分类时,其分类性能较差。本文以影视音频文档为研究对象来探讨复杂音频文档的事件分类问题,尤其是对交叠音频事件的分类,提出了结合纯净的音频事件模型和聚类信息进行分类的算法,该算法通过挖掘纯净音频事件样本和交叠音频事件样本的先验分布信息来提高交叠音频事件样本被分类为其所包含的某一音频事件的概率。实验表明,该算法不但能有效地提高对交叠音频事件样本的分类性能,而且对纯净音频事件样本的分类性能也有所提高,能达到整体分类性能的提高,从而可以作为对复杂音频文档进行音频事件分类的一种有效方案。