基于VQ-GMM的音频分类

来源 :信息工程大学学报 | 被引量 : 26次 | 上传用户:qianjun0412064
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音频分类在基于内容的音频、视频检索和分析中起着重要作用。文章针对静音、语音、音乐和环境背景音4类音频提出基于VQ-GMM的分类算法。首先通过阈值判决区分静音和非静音,然后利用VQ-GMM分类器将非静音进而分为语音、音乐和环境背景音。实验结果表明该方法的分类性能良好,平均正确率可达95%。
其他文献
文章从代数角度讨论了KM1M2生成器输出序列的密码学特性,得到了其输出序列具有较长的周期,较高的线性复杂度,尖锐的自相关特性和弱的互相关特性,并具有相关免疫性等结果.
针对边界约束函数全局最优化和多峰寻优问题,提出一种直接搜索算法。该算法通过构造一种具有特定空间结构的模式解,并设定运动规则使其具备较强的局部寻优能力,结合Monte Car
JB IG是二值图像压缩编码标准之一,主要压缩原理是基于条件概率的算术编码。JB IG标准提供了两种标准模板来确定条件概率。本文分析了两种不同模板的压缩编码效果,并结合最低