论文部分内容阅读
随着科技创新和网络技术不断深入发展,以往的身份验证已然无法为用户的信息安全和财产提供有力的保障,传统认证方式正逐渐被生物特征认证所取代。做为生物特征的一种,声纹具有获取方便、采集成本较低、安全性高等诸多优点,逐渐被应用到现实生活中的各个领域。特别是在最近几年的司法案件中,越来越多的语音样本被法院认定为有效的司法证据,这也使得声纹鉴定技术的理论意义和实用价值越来越受到人们的重视。本文是以智能声纹鉴定系统的研究与开发为基础来开展工作的,首先详细阐述了说话人识别的研究背景、发展历史、国内外应用现状,同时详细阐述了声纹鉴定在国内外司法领域的应用及当前存在的热点问题。并进一步详细介绍了声纹鉴定的基本原理和具体操作流程,在此基础上对声纹唯一性进行了实验论证。然后详细介绍了声纹鉴定领域目前的两个热点问题:跨信道语音和多说话人语音。阐述了经典的GMM-UBM说话人识别系统,并进一步介绍了 GMM-SVM说话人识别系统和近年来较为主流的基于i-vector模型的说话人识别系统。然后介绍了信道补偿算法PLDA的基本原理。最后以社保音频为语音材料,进行了同信道和跨信道的实验对比。同时更深入一步的学习了说话人分割聚类技术,介绍了近年来较为主流的几种说话人分割技术和说话人聚类技术,并做了相关的实验。本文最后详细的阐述了智能声纹鉴定系统的研究背景、系统研发的详细过程和该系统的使用方法及其所能实现的功能。