说话人识别系统的研究与开发

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:laopoxqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术作为语音信号处理技术的一个重要组成部分,有着十分广阔的研究和应用前景。目前,已经有几种识别方法应用于说话人识别,但识别率、系统稳定性、噪声鲁棒性还不是很理想。本文提出支持向量机技术应用于说话人识别,与传统的方法比取得了较高的识别率和较强的鲁棒性。支持向量机技术是一种统计学习理论,结合经验风险和期望风险的平衡点,兼顾学习能力和推广能力,是一种较新的机器学习方法。它基于结构风险最小化原则的模式分类方法,在处理样本中非线性、高维数问题时有很大的优势,所以在应用基于语音样本的说话人识别上有良好的效果。本文依拖实际项目,在阐述说话人识别原理的基础上,充分考虑说话人识别系统的识别率、识别速度、稳定性等综合因素,采用能够反映人对语音的感知特性的线性预测倒谱系数LPCC 作为特征参数,LPCC 的重要性还在于,它提供了一组简洁的语音信号模型参数,这一组参数较精确地表征了语音信号的频谱幅度,而分析它们所需的运算量相对来讲却不大; 同时结合矢量量化技术,成功开发出语音检索系统。矢量量化技术不同于传统的标量量化方法,基本思想是将若干标量数据联合成一个矢量,然后对矢量空间进行空间划分,给予整体量化,从而更高质量地压缩数据。由于LBG 算法其理论上的严密性、应用于上的简便性以及较好的设计效果,在特征码本聚类时采用LBG 算法,保证了码本的质量,系统的质量也得到保证。针对说话人识别系统在识别率的不高、噪声下的不稳定性一些具体实际问题,本文通过实验构造码本的分辩函数,对特征参数各维分量的识别能力进行定量分析; 也通过实验,对不同噪声背景下的说话人识别进行了相关分析,为说话人识别研究提供有力的数据和积极的建议。
其他文献
  本文开展了海南岛万宁小海泻湖水动力模型研究,用有限体积法对流体运动N-S方程进行离散,对速度压力耦合求解采用SIMPLE算法,建立了泻湖水动力模型,对万宁小海综合整治各种方
说话人识别可以看作是语音识别的一种,它是一种根据说话人的语音来判断说话人身份的技术,在军事、司法、医学等领域都有广泛的应用.由于矢量量化的分类特性,同时又可以对数据进
本文对基于竞争学习的数据广播调度问题进行了研究。文章分析了神经网络的原理,采用神经网络方法,按照竞争学习的观点,较全面地考虑影响调度的诸多因素,设计较好的数据广播调度算