基于神经网络的说话人识别算法研究

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:wanxueguan55
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人身份识别是根据说话人语音信号所包含的信息来识别身份的一种生物认证技术,以其独特的方便性、经济性和准确性得到了广泛的应用。神经网络是一种基于非线性理论的分布式并行处理网络模型,具有很强的模式分类能力和鲁棒性,因此本文研究基于神经网络的说话人识别算法。   本文详细介绍了语音信号的采集、数字化预处理、特征参数提取、模型训练和识别,同时对BP神经网络、RBF神经网络、学习矢量量化(LVQ)网络做了详细的介绍。说话人身份识别的核心部分就是语音信号特征参数选取及识别算法的选取。对现有特征参数选取方法做了比较,MFCC参数具有良好的识别性能和抗噪能力,因此本文选用了模拟人耳听觉特性的Mel倒谱参数(MFCC)。在模式识别算法上,本文采用了神经网络模型,分别通过采用BP神经网络、RBF神经网络和LVQ神经网络模型进行训练和识别,实现了说话人身份识别。   本文的研究结果如下:   (1)针对BP算法易陷入局部最小点和收敛速度慢,研究比较了遗传优化BP算法和粒子群优化算法。利用BP算法和遗传优化BP算法实现了说话人识别,遗传优化BP算法取得了较好的识别效果。当语音识别时长为20秒时,它的识别率达到了95.42%。   (2)对原有RBF网络进行了改进,结合遗传算法实现了说话人识别。当语音识别时长为15秒时,得到了92%的识别率。   (3)研究比较了LVQ、模糊算法LVQ以及基于EM的LVQ算法,同时应用这些算法实现了说话人识别。在相同条件下,基于EM的LVQ网络取得了最好的效果。当说话人训练样本聚类点为5时,识别率达到了96.8%。
其他文献
我们先来看一下山东省临沂市2008年中考数学试卷的第25题:rn题目 已知∠MAN,AC平分∠MAN.rn(1)在图1中,若∠MAN=120°,∠ABC=∠ADC=90°,求证:AB+AD=AC.
期刊
野生大豆可以在相对较严重的盐碱地环境下生长,说明在野生大豆中存在着耐盐和耐碱两套机制,是研究植物盐、碱胁迫生理机制的理想材料。目前对于植物盐胁迫生理和分子机制的研
在现代无线通信系统应用中,为了获得更高的数据传输速率,信号包含多路相位和幅度多变的副载波,导致信号峰均比(PAR)很高。为了满足系统对线性度很高的要求,功放必须能够产生
在历年的中考试题中,求三角函数值是一个热点.现以中考试题为例,说明求三角函数值的常用方法.rn一、运用定义求三角函数值rn例1(2019·眉山)如图1,在Rt△ABC中,∠B=90°,AB=5
期刊
从大规模的胎脑组织cDNA克隆和测序计划中,本文通过生物信息学分析选取了4条全长cDNA进行进一步的研究,以探讨这些基因的功能及其与人类疾病的关系。 分离到的人类新基因C4o
利用PEG方法进行核生3号小麦与柴胡对称体细胞杂交及农杆菌介导gai矮杆基因苗端转化核生3号小麦。主要研究过程及实验结果如下: 以悬浮培养细胞来源的柴胡(Bupleurum scorzonerifolium Willd.)原生质体,与核生3号小麦(Triticum aestivum)愈伤组织来源的原生质体用PEG法诱导融合。由于来源材料的长期继代,柴胡原生质体的再生能力已经丧失,核生3号小麦
头索动物文昌鱼是目前存在的与脊椎动物最接近的无脊椎动物,是介于无脊椎动物和脊椎动物之间的过渡类型,其形体结构、发育模式和基因组都是脊椎动物最简单模型的代表,对头索动物
近年来,有机-无机钙钛矿材料逐渐成为光伏界新的焦点。基于这种材料的钙钛矿太阳电池(PSCs)的转换效率从最初的3.8%飞速发展到现在的22.1%,其增长速度之快令人惊讶。然而,随着其光电转换效率逐渐的接近理论效率,人们对钙钛矿太阳电池的研究逐渐从最初的提高其转换效率转移到其他方面,如制备大面积的钙钛矿太阳电池、提高电池的稳定性以及柔性器件等。本文主要针对柔性钙钛矿太阳电池的制备做出一系列的探索性研
股权分置改革是中国资本市场针对公司治理基础的一项根本性制度变迁,股东投票出席行为是中国资本市场上市公司治理的重要环节。本文利用股权分置改革分类表决数据,从影响投票
本文研究了一系列荧光蛋白和毛色等标记基因在转基因小鼠中的应用。首次报导了mRFP1报告基因在转基因小鼠中的应用。我们发现mRFP1外显率高、日光灯下清晰可辨、剂量效应明显