广播语料的语音/音乐自动分割方法研究

来源 :中国人工智能学会第12届全国学术年会 | 被引量 : 0次 | 上传用户:zhqr1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了两种对广播语料进行语音和音乐分割的建模策略基于GMM的竞争建模策略和区别性建模策略──的实现,这两种策略的建模都采用了MFCC系数作为输入信号的特征参数。通过对实际新闻广播语料的测试,表明这两种策略都能建立起有效地分割语音段和音乐段的分类模型;对于背景音乐和噪音较大的新闻语料,按照竞争建模策略构造的分类模型具有较好的语音/音乐分割性能。文章同时对不同的特征向量构造做了研究,实验表明12维的MFCC参数及其一阶差分、二阶差分能使按两种不同策略建立起来的分类模型都达到最好的语音/音乐分割效果。
其他文献
本文通过对比不同的交通信息采集技术,提出利用广泛安装的智能车载终端和其他相关设备进行交通信息采集,为ITS系统提供基础数据源,为实现车辆准确定位、实时路径规划和优化提
《疯狂英语·理论版》(中国外语教学期刊质量检测入网期刊、中国期刊方阵入选期刊、CNⅪ中国期刊全文收录数据库入选期刊、中国社会科学期刊精品数据库收录期刊、《中国核心
本研究在对交通路标的图像获取和处理技术与路标图像的分块与特征提取方法进行重点分析后,提出采用BP神经网络对路标进行识别。对路标识别算法做了详细的设计、分析与优化,并
会议
本研究针对ITS中交通车辆的彩色图像边缘检测的实际问题,对相似关系矩阵算法与其它边缘检测算法进行了特点分析,提出了适用本课题的改进的相似关系矩阵算法。采用新算法的车辆
本文通过将运动物体的轮廓特征解卷绕为一维的距离信号,在此特征表示的基础上提出了一种新的运动人体检测方法。该方法首先采用K均值聚类算法分别对大量人体样本和非人体样本
会议
本文把话题识别的技术应用到邮件分类管理中,提出了基于话题识别的邮件分类管理模型。在邮件话题识别中,我们结合邮件的一些结构化特征,改进了single-pass算法。在综合考虑标
本文针对一类具有输入时滞的非高斯随机分布系统,提出了基于广义PI控制器的跟踪控制方法。首先采用B样条模型和非线性权模型来建立概率密度函数和控制输入之间的关系,从而将
会议
本研究针对网络中普遍存在的大时滞现象以及网络参数实时变化问题,提出了一种基于灰色预估神经网络控制器的主动队列管理算法(AQM)。利用RBF神经网络的自学习能力解决网络实时
为了提高基于GMM的大词汇量连续语音识别系统的实时性能,在两种常用的似然率快速计算技术──基于VQ的高斯选择技术和部分距离消去算法(PDE)──的基础上提出了似然率快速计
会议
本研究对挖掘机工作装置进行了运动学分析,利用D-H法的标准形式得到铲斗末端的位置和姿态表达式。采用几何法获得关节空间与-驱动机构空间的转换关系,得到了铲斗的姿态与各个
会议