改进的稀疏最小二乘支持向量机在语音识别中的应用

来源 :太原理工大学 | 被引量 : 3次 | 上传用户:mbc3204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是一种最直接、最便捷的人机交互手段,属于多维模式识别的范畴。最小二乘支持向量机是机器学习领域目前研究较热的一种模式识别算法,作为标准支持向量机的一种扩展,具有小样本学习、能够避免“高维维数灾难”和模型训练算法简单易实现的优点,因此适用于复杂的语音信号的识别。但其具有解的稀疏性缺失的缺点,造成模型复杂度的提高和系统识别速度的降低,本文针对这个问题展开了研究,具体研究内容如下:(1)深入研究了语音识别系统和最小二乘支持向量机原理,将最小二乘支持向量机引入到语音识别系统中,克服了传统语音识别方法中隐马尔可夫模型需要先验分布知识、人工神经网络容易出现“过学习”的缺陷。(2)仔细研究了模型参数对系统的学习能力和泛化能力的重要性,提出采用粒子群全局优化算法结合K折交叉验证的方案进行最佳参数寻优,避免了人工手动调试复杂和网格算法耗时长的问题。(3)在深入研究最小二乘支持向量机稀疏性缺失的原因和语音样本特征维数对模型性能影响的基础上,提出采用基于独立成分分析的最小二乘支持向量机稀疏化方法。该方法首先采用独立成分分析方法进行语音特征降维;然后在模型训练之后采用基于独立成分分析的快速剪枝算法对核矩阵进行约简,约简过程中采用峰度和偏度的组合作为独立成分重要性的度量指标,以此来解决独立成分的排序问题。韩语语音库上的实验表明,该算法在有效实现模型稀疏化的同时保证了模型识别精度。(4)针对非支持向量参与模型训练会造成模型复杂度提高和模型识别性能降低的问题,本文从数据挖掘和支持向量的几何分布含义两个方面出发,提出了基于支持向量预选取的最小二乘支持向量机稀疏化算法。该算法在模型训练之前,将K均值聚类算法提取的关键表征样本和中心距离比值算法选取的边界样本的并集作为预选支持向量,从而有效实现了稀疏化。经韩语语音库和Aurora-2语音库实验表明,该方法在几乎不损失识别精度的基础上提高了识别速度,达到了稀疏化的目的。
其他文献
禽流感是由甲型流感病毒引起的一种禽类易感的人兽共患烈性传染病。由于基因突变、基因重配、基因重组等因素,新型禽流感病毒(如H5N6,H5N8,H7N9等)不断出现并反复暴发,造成大量家禽
目前,嵌入式技术的正广泛应用于制造工业、过程控制、通讯、仪表、消费类产品等领域。其中嵌入式操作系统的发展尤为突出,出现了一些优秀的开放源代码的操作系统,如Linux和μ
脑卒中是威胁人类健康的第二大致死性疾病,具有高患病率、高复发率、高致残率、高死亡率的特点,而缺血性卒中占了脑卒中的60%~70%,目前的临床治疗效果还不尽人意。近年来,研究者
磷是生命活动必需的矿质元素之一,也是湖泊富营养化的主要限制因子。沉积物是水生态系统的“磷源”与“磷汇”,对水生态系统的结构与功能着重要的影响。Fe-P和Ca-P是沉积物磷的
阿尔泰山地区地处欧亚大陆腹部,拥有独特的动植物群落,属于古北界欧洲-西伯利亚生物地理区。一直以来,阿尔泰山地区的野生动物调查主要集中在东部,西部缺乏系统的实地科学考察,野
本文在数字调谐器产业化项目基础上,给出了应用于宽带的锁相环中低抖动和低杂散鉴频鉴相器和电荷泵的设计,同时分析其对于锁相环路的影响,从而在环路基础上对鉴频鉴相器和电荷泵
钝头蛇科Pareatidae是一类广泛分布于中国南部、中南半岛和马来群岛的蛇类,按照最近的成果,可划分为3属14种,其中属Pareas含10种,分别为:Pareasboulengeri;P.carinatus;P.formose
随着无线通信技术的迅速发展,无线通信设备已经成为最受大众欢迎的通信工具。然而无线通信设备在给人们生活工作带来便利的同时,也带来了一些负面效应。特别是在医院内使用手机等无线设备,由于其在使用过程中产生的高频电磁辐射对医用电子仪器的干扰,在诊断和治疗中产生了影响仪器正常工作的异样和故障。这种情况会导致治疗的失败甚至可以导致患者的生命危险。这个严重的问题越来越成为人们关注的焦点。本文大致介绍了电磁兼容的
在无线通信系统中,无论是基站设备还是诸如手机等终端设备,天线都是系统中必不可少的模块。作为无线通信系统中的重要部件之一,天线的性能好坏直接影响到系统的通信质量。微
介绍了针对中性点非有效接地的中、低压配电系统的消弧消谐选线综合装置的研制,该装置能够自动的排除弧光接地、谐振接地、金属接地以及高阻接地等单相接地故障,同时能够对故障