【摘 要】
:
音频数据分类分割是音频数据处理系统最常用、最重要的预处理技术,显著地影响系统的性能和效果,具有重要的研究价值。在音频样例检索系统中,需要为操作人员提供便捷、高效的
论文部分内容阅读
音频数据分类分割是音频数据处理系统最常用、最重要的预处理技术,显著地影响系统的性能和效果,具有重要的研究价值。在音频样例检索系统中,需要为操作人员提供便捷、高效的样例提取工具,从多媒体文件中截取音频片段,作为查询的样例数据。截取的样例一般是包含操作人员感兴趣、含有重要信息、内容具有一定完整性的片段。尽管音频信息无法快速浏览,但如果在操作人员截取音频样例之前,先使用音频分割分类技术获取音频文件内容的结构化信息,然后采用可视化技术呈现给操作人员,将便于操作人员快速浏览文件内容、便捷、高效地选取音频片段,完成样例制作任务。本文以音频样例提取为应用背景,研究并实现了基于多级分类的音频数据分类与分割算法,并将该算法用于样例提取,提高操作人员工作效率,具体工作如下:(1)采用随机森林算法实现音频的粗分类,将音频数据分为音乐、纯语音、含背景音乐语音、含背景噪音语音和背景音,共五类。采用基于音频段的分割方法实现音频的粗分割,将音频数据分为音乐、语音和背景音三大段。(2)对于音乐类数据,针对操作人员更多关注有歌声音乐而非纯音乐的特点,提出了基于节拍的分类方法,将音乐类数据细分为纯音乐与有歌声音乐两种。实验结果表明,该方法对于不同类型的音乐数据均具有较好的性能。(3)对于语音类数据,如果语音时长过长,不利于快速地选择样例片段的提取位置。本文提出了基于高斯统计直方图特征和单高斯关键背景模型的语音分割方法。训练单高斯模型并优选关键背景模型,采用统计方法将梅尔倒谱系数特征映射为直方图特征,并用基于余弦距离的聚类方法进行聚类,聚类结果即为分割结果。利用该方法对语音类数据进行细分割,得到具有相对独立性的子片段作为候选的样例片段。实验结果表明本文提出的语音分割方法准确率高、速度快。
其他文献
<正>杜牧《答庄充书》中说:"观足下所为文百余篇,实先意气而后辞句。"这样的评价可谓说到了作文的要害。立意的深浅高低,直接决定了高考作文的等级。那么,怎样才能使高考作文
作为科技翻译的一个重要分支,医学英语翻译在我国一直处在重要地位。本文分别从宏观和微观的角度分析医学英语的语言特点,并提出相应的翻译策略及方法。以促进医学译文更加如
<正>原发免疫性血小板减少症(primary immune thrombocytopenia,ITP)是一种免疫介导的血小板加速破坏并且抑制其产生的获得性疾病。以血小板短暂或持续的减少,出血危险性增加
根据美国宾夕法尼亚大学“智库与市民社会项目”(The Think Tanks and Civil Societies Program)的研究,加图研究所是当今美国国内政策研究领域的十大顶尖智库之一,在美国社
在位于大朗镇的长盈精密生产基地内,68台监控设备正在工作人员的操作下,按部就班地进行着测试。在未来不长的时间里,这里或将成为东莞首家无人工厂。现在,长盈精密要做的就是确保
<正>庞巴迪独行侠2015款履带车面世庞巴迪Can-Am2015款全新涡轮增压版独行依推出雪地履带版UTV,这台89 kW的涡轮增压版独行侠成为最终的冬季冒险机器。这台Can-Am"雪行者"有
<正>1烘干塔操作现状及存在的问题目前我公司拥有造气炉26台[2 650 mm炉12台,(3 000~3 300)mm炉14台],造气生产所需的原料煤主要由型煤球与型煤棒2个生产车间供给。其中
<正>住房供应和房价问题涉及人民群众切身利益,关系经济健康发展、社会和谐稳定,近年来,国家加大了对房地产市场的宏观调控。一、武汉房产新政概况最近,房地产市场频出重拳,
基于TCP/IP网络的电视电话会议系统随着新技术的发展已被广泛应用,其中高清电视电话会议系统也逐渐成为当前视频会议的主流,该系统能有效地提升会议效率,减少会议成本,减轻工
浅析电机直流和交流耐压试验的作用林健,孔羚(黑龙江化工总厂齐齐哈尔市161041)1电机直流和交流耐压试验的意义电机的绝缘预防性试验是保证电机运行稳定性、安全性的重要措施。通过试验