基于元音MFCC的说话人识别系统研究

来源 :电子测量与仪器学报 | 被引量 : 0次 | 上传用户:z5748259
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别从本质上看是从语音信息中提取说话人特征,并通过一定的方式进行模式识别的过程。辨别说话人的方法很多,本文认为先从语音中提出元音,再通过计算元音的MFCC(美尔频标倒谱系数)特征参数,并与DTW(动态时间规整)结合进行多人多单词试验,实验证明这种识别方式能提高识别率5%左右——从原字平均识别率为83%提高到取元音后平均识别率为88%。
其他文献
探索好的教学方法,达到最佳的教学效果,应根据教学对象、教学条件及教师自身素质,对各种教学方法进行研究和探讨.
本文介绍了一种把图片等二进制文件在数据库中存取的方法,分析了这种方法和一般方法的不同,给出了此方法的基本原理,并通过实例进行方法的说明及实现。
近几年,随着GIS、RSP等图形图像软件的发展,在影像局部显示、裁剪等方面都要选取范围或对图形的操作。根据这些需求,设计并实现了一个矩形操作类,实现了矩形的上下左右等八个方向的拖拉、反转、移动等操作功能以及实时显示当前矩形坐标。
文中提出了基于QR分解的线性辨别分析与非线性核辨别分析方法,并将其用于雷达目标一维距离像识别。与传统Fisher辨别分析方法相比,新方法运用QR分解取代奇异值分解或伪逆方式
自90年代末以来,政府越来越依赖财政稳定政策调控国内经济,但在经济日益融入全球化的进程中,一系列牵制因素将逐步而有力地削弱财政稳定政策的自主性和有效性,导致政策效果捉