基于MFCC的声纹识别系统研究

被引量 : 0次 | 上传用户:huanying19870604
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和网络通信的发展,整个人类社会进入了信息化时代,需要面对一个很重要的问题——信息安全。身份鉴别是信息安全的重要部分,它影响着我们生活的各个领域。声纹和指纹、人脸、DNA一样,是一个人内在的、唯一的特征,通过提取声纹中的特征来进行身份鉴别的技术不断地发展起来,引起了许多国内外学者的研究。声纹识别技术研究的关键是语音信号的前端处理、特征提取、建模方法以及抗噪声等问题。本文主要针对以上问题,展开了相关的研究。首先,为了减小噪声信号的干扰,提高语音信号的信噪比,研究了声纹识别语音信号的预处理方法,分析了谱减法语音增强算法,并对谱减法进行了改进,重点提出了基于递推最小二乘法(RLS)的自适应滤波语音增强算法,仿真实验结果表明,RLS自适应滤波的语音增强效果更好。然后,对声纹识别中语音信号的特征提取做了详细研究,描述了特征参数共振峰、线性预测倒谱系数(LPCC)、梅尔频率倒谱系数(MFCC)的提取方法,重点分析介绍了基于人耳耳蜗模型的Gammatone频率倒谱系数(GFCC),提出了特征参数GFCC的提取算法,并通过仿真实现了共振峰、LPCC、MFCC、GFCC的提取。其次,为了提高声纹识别系统的鲁棒性和识别率,研究了高斯混合模型(GMM)的模型参数估计期望最大化(EM)算法及初始化的方法,详细阐述了GMM的训练、识别方法。进而通过仿真实验深入研究了基于GMM的声纹识别系统在不同特征参数维数、不同模型混合数以及不同信噪比环境下的实验效果,比较了不同维数的特征参数LPCC、MFCC、GFCC的性能、不同GMM混合数的性能。此外,在不同信噪比下,本文提出了基于GFCC与RLS自适应滤波语音增强算法相结合的声纹识别算法。实验结果表明,在不同信噪比下,特征参数GFCC具有抗噪声能力,能提高语音信号的可懂度和清晰度,比MFCC具有更好的识别性能和鲁棒性;并且特征参数GFCC与RLS自适应滤波语音增强算法相结合的声纹识别系统,识别率能达到90%以上,识别性能优于改进谱减法与MFCC相结合的识别算法。最后,本文对研究中的成果进行了总结分析,并对研究中的不足之处做了详细说明,进而提出了未来的研究方向。
其他文献
培养什么人、如何培养人,是我国社会主义教育事业发展中必须解决好的根本问题。在全球化经济时代,拔尖创新人才是国家重要的战略资源,更是一个民族核心竞争力的实际体现。我
公共课政策是属于课程政策中的一个重要部分,其内容涉及到学科政策内容,所以也是教育质量政策中的一个重要范畴。2003年至2014年期间,虽然我国逐步地重视高校本科公共课的发
伴随着我国基础教育师资队伍专业化的发展,全日制教育硕士自2009年设置以来一直备受关注。它承担着为我国基础教育培养专业化、高层次师资队伍的重担,但是由于种种原因我国全
1969年互联网在美国诞生,通过四十多年时间的发展普及,已经深刻改变了人类社会生活。青年大学生作为有较深知识储备、较强接受能力的群体,受网络影响最大。当代大学生充分利
以研究事物的复杂性特征为主,坚持事物非还原性的复杂性科学,在兴起的三十多年来在各学科领域得到广泛关注并引起了人们思维的转向和方法论的变革。随着我国的高等教育进入到
大学标志性建筑,是大学形象的缩影和大学精神的彰显;大学标志性建筑,是大学师生引以为豪的标识和教育意义的象征;大学标志性建筑,是大学的符号和大学理念的承载。大学标志性
高校作为培养知识精英和顶尖人才的重要基地,承担着为广大学生提供优质高等教育资源并营造和谐学习环境的重要责任。近年来,随着高校的不断发展,高校校园安全问题日益突出,其
老舍笔下诸多人物的命运起落寄寓着作家的死亡意识,这种死亡意识具体表现为个人人格的殉难、民族气节的保全和浓厚的宗教意识三个方面,其死亡意识的形成与作家末世人的生活境
城镇化的不断推进带来的是建筑行业的蓬勃发展,但随之而来的还有大量能源、资源的消耗和大量增长的建筑垃圾。一方面废弃物占用土地、污染环境,另一方面建筑施工中的扬尘也与
教育是构建和谐社会的基石,是人才培养的途径,是国家发展的基础。“百年大计,教育为本”是我国历代领导人的治国方略,只有坚持优先发展教育,才能更好为社会经济发展提供人才