论文部分内容阅读
说话人识别技术作为语音信号处理技术的一个重要组成部分,有着十分广阔的研究和应用前景。目前,已经有几种识别方法应用于说话人识别,但识别率、系统稳定性、噪声鲁棒性还不是很理想。本文提出支持向量机技术应用于说话人识别,与传统的方法比取得了较高的识别率和较强的鲁棒性。支持向量机技术是一种统计学习理论,结合经验风险和期望风险的平衡点,兼顾学习能力和推广能力,是一种较新的机器学习方法。它基于结构风险最小化原则的模式分类方法,在处理样本中非线性、高维数问题时有很大的优势,所以在应用基于语音样本的说话人识别上有良好的效果。本文依拖实际项目,在阐述说话人识别原理的基础上,充分考虑说话人识别系统的识别率、识别速度、稳定性等综合因素,采用能够反映人对语音的感知特性的线性预测倒谱系数LPCC 作为特征参数,LPCC 的重要性还在于,它提供了一组简洁的语音信号模型参数,这一组参数较精确地表征了语音信号的频谱幅度,而分析它们所需的运算量相对来讲却不大; 同时结合矢量量化技术,成功开发出语音检索系统。矢量量化技术不同于传统的标量量化方法,基本思想是将若干标量数据联合成一个矢量,然后对矢量空间进行空间划分,给予整体量化,从而更高质量地压缩数据。由于LBG 算法其理论上的严密性、应用于上的简便性以及较好的设计效果,在特征码本聚类时采用LBG 算法,保证了码本的质量,系统的质量也得到保证。针对说话人识别系统在识别率的不高、噪声下的不稳定性一些具体实际问题,本文通过实验构造码本的分辩函数,对特征参数各维分量的识别能力进行定量分析; 也通过实验,对不同噪声背景下的说话人识别进行了相关分析,为说话人识别研究提供有力的数据和积极的建议。