基于核主成分分析与神经网络的文本无关说话人识别研究

来源 :北京工商大学 | 被引量 : 0次 | 上传用户:liyang0ly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是根据人特有的语音信号识别说话人身份的一种生物认证技术。说话人识别的关键技术包括两个方面:一是如何从数据量相当大的原始语音信号中提取出反映说话人声音特色的特征参数;二是如何设计识别能力强的分类器。 本文对说话人识别系统的研究分别从特征提取与分类器设计两方面进行。 对于特征参数的提取,在对目前存在的单一主流特征进行研究的基础上,对基于声道的线性预测倒谱系数和基于人耳听觉特性的Mel频率倒谱系数及二者的差分系数进行了一系列特征组合研究,将研究结果应用于文本无关说话人识别,并对各种多参数组合特征进行了评价,通过计算机仿真实验,表明所采用的多参数组合特征有利于改善识别效果。为了降低组合特征的维数、缩短训练和识别时间,提高系统识别效率,研究了主成分分析和核主成分分析的最优降维性质在文本无关说话人识别中的应用。核主成分分析方法采用非线性方法提取主成分,是主成分分析的改进算法。本文提出了利用核主成分分析选择合适的核函数在高维空间提取组合特征主成分的方法,各组合特征经过核主成分分析降维,损失的特征信息最少,在保证识别性能的同时,后续阶段的计算开销将会大大减少。实验结果表明,核主成分分析不仅实现了合理降维,而且能取得比传统主成分分析更好的识别性能。 对于分类器的设计,主要应用人工神经网络技术,设计了基于概率神经网络的说话人识别系统。针对概率神经网络训练样本的数目比较大时,存在的内存需求巨大和运算时间较长的问题,将模糊C-均值聚类算法引入概率神经网络分类器。融合两者的优点,提出了基于模糊C-均值聚类的概率神经网络说话人识别系统。实验结果显示该系统具有较好的识别性能。
其他文献
人体皮肤是身体内部与外界的天然屏障,能否通过对皮肤生理参数的测量来准确地掌握人体机能的变化是当今医学界的一个重大研究课题。所以测量人体皮肤指标,分析人体可能患有的病
随着科学技术的发展,机器人的应用越来越广泛。然而,大部分的机器人只是为特定的工作环境而开发的,一些更多、更加复杂的任务需要多个机器人的协作才能完成,每个机器人都有自身擅
磁共振成像(Magnetic Resonance Imaging,MRI)系统是目前最先进最昂贵的医学诊断设备之一。谱仪是其中的关键部件,价格昂贵。目前国内已有多家磁共振系统集成商,但MRI谱仪技术仍
近年来,复杂网络受到来自物理、生物、数学、计算机、经济等不同学科领域的研究者越来越多的关注,已经成为一个研究热点。利用统计分析方法,结合计算机模拟仿真技术,本论文对复杂
个性化信息服务旨在解决按照用户的需求传递信息的问题。随着信息科学与技术的发展,信息已经渗透到人们生活的各个方面。移动电话的普及和移动数据业务的发展带来了移动网络信
国际EPC总承包项目,即设计—采购—施工(Engineering,Procurement and Construction),是一种由承包商进行全部设计、采购和施工,提供一个配备完善的设施,转动钥匙(Turn key)即可运
词语对齐是跨语言自然语言处理领域的一个基本问题,许多基于双语语料库的应用(女NSBMT、EBMT、WSD、词典编纂)都需要词汇级别的对齐。 以往词语对齐方法对语言学信息在对齐
月球车是我国月球探测二期工程中最重要的组成部分,运动规划则是月球车具备自主能力的根本保证,也是月球车实现自主控制的难点。本文以六轮独立驱动的摇臂式月球车为研究对象,在
现场总线是自动化领域的计算机网络,是当今自动化领域技术发展的热点之一。它以总线为纽带,将现场设备连接起来成为一个能够相互交换信息的控制网络,是一种双向串行多节点数
多标签的数据类型是比单标签的数据的应用更为广泛的数据类型。相对的,多标签数据的分类比单标签数据的分类更为复杂且耗费更高,然而其训练的分类器预测的准确率比单标签的要