改进的稀疏最小二乘支持向量机在语音识别中的应用

来源 :太原理工大学 | 被引量 : 3次 | 上传用户:mbc3204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是一种最直接、最便捷的人机交互手段,属于多维模式识别的范畴。最小二乘支持向量机是机器学习领域目前研究较热的一种模式识别算法,作为标准支持向量机的一种扩展,具有小样本学习、能够避免“高维维数灾难”和模型训练算法简单易实现的优点,因此适用于复杂的语音信号的识别。但其具有解的稀疏性缺失的缺点,造成模型复杂度的提高和系统识别速度的降低,本文针对这个问题展开了研究,具体研究内容如下:(1)深入研究了语音识别系统和最小二乘支持向量机原理,将最小二乘支持向量机引入到语音识别系统中,克服了传统语音识别方法中隐马尔可夫模型需要先验分布知识、人工神经网络容易出现“过学习”的缺陷。(2)仔细研究了模型参数对系统的学习能力和泛化能力的重要性,提出采用粒子群全局优化算法结合K折交叉验证的方案进行最佳参数寻优,避免了人工手动调试复杂和网格算法耗时长的问题。(3)在深入研究最小二乘支持向量机稀疏性缺失的原因和语音样本特征维数对模型性能影响的基础上,提出采用基于独立成分分析的最小二乘支持向量机稀疏化方法。该方法首先采用独立成分分析方法进行语音特征降维;然后在模型训练之后采用基于独立成分分析的快速剪枝算法对核矩阵进行约简,约简过程中采用峰度和偏度的组合作为独立成分重要性的度量指标,以此来解决独立成分的排序问题。韩语语音库上的实验表明,该算法在有效实现模型稀疏化的同时保证了模型识别精度。(4)针对非支持向量参与模型训练会造成模型复杂度提高和模型识别性能降低的问题,本文从数据挖掘和支持向量的几何分布含义两个方面出发,提出了基于支持向量预选取的最小二乘支持向量机稀疏化算法。该算法在模型训练之前,将K均值聚类算法提取的关键表征样本和中心距离比值算法选取的边界样本的并集作为预选支持向量,从而有效实现了稀疏化。经韩语语音库和Aurora-2语音库实验表明,该方法在几乎不损失识别精度的基础上提高了识别速度,达到了稀疏化的目的。
其他文献
目前,嵌入式技术的正广泛应用于制造工业、过程控制、通讯、仪表、消费类产品等领域。其中嵌入式操作系统的发展尤为突出,出现了一些优秀的开放源代码的操作系统,如Linux和μ
随着无线通信技术的迅速发展,无线通信设备已经成为最受大众欢迎的通信工具。然而无线通信设备在给人们生活工作带来便利的同时,也带来了一些负面效应。特别是在医院内使用手机等无线设备,由于其在使用过程中产生的高频电磁辐射对医用电子仪器的干扰,在诊断和治疗中产生了影响仪器正常工作的异样和故障。这种情况会导致治疗的失败甚至可以导致患者的生命危险。这个严重的问题越来越成为人们关注的焦点。本文大致介绍了电磁兼容的
在无线通信系统中,无论是基站设备还是诸如手机等终端设备,天线都是系统中必不可少的模块。作为无线通信系统中的重要部件之一,天线的性能好坏直接影响到系统的通信质量。微
介绍了针对中性点非有效接地的中、低压配电系统的消弧消谐选线综合装置的研制,该装置能够自动的排除弧光接地、谐振接地、金属接地以及高阻接地等单相接地故障,同时能够对故障