基于前端处理噪声环境下稳健的说话人识别研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:bleachdou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术在公安、安全、司法等领域有着重要的应用价值和广阔的应用范围。现有说话人识别系统在很安静的环境下通常可以取得比较好的识别效果,但当有噪声干扰时,识别性能将急剧下降,严重阻碍了说话人识别技术在实际中的应用。针对此问题通常可以采取三种途径解决,一是前端增强处理,二是采用抗噪性更好的特征参数或对现有参数进行组合增强抗噪性,三是对匹配模型进行补偿,提高对噪声的抵抗能力。本文主要研究第一种方法,即采用前端语音增强处理提高说话人识别系统的抗噪性能。主要工作为:  1.探讨了稳健的说话人识别的研究现状和研究意义。  2.针对说话人识别系统中,无声段对识别率的不利影响,提出一种结合语音自身短时相关性和能量相结合的相关能积算法,并对语音音节间相关性弱的缺点采取了补偿,进一步提高了检测的准确性。  3.建立了基于DTW和GMM的两个说话人识别系统,建立了文本相关和文本无关的两个语音数据库,并做了多种频带的噪声对两种系统进行冲击实验,得到了大量实验数据,为后继的研究奠定了基础;针对基音频率抗噪性较好,而变异性较大的特点,本文对基音频率进行了探讨,分离了基音频率的两个特性,并采用双门限策略,提高了基音频率对变异性的克服能力。  4.研究了单通道语音增强方法,包括谱减、维纳滤波、单通道信号子空间语音增强算法,在单通道信号子空间语音增强算法研究过程中针对拉格朗日乘子选取问题,提出一种自适应选择拉格朗日乘子的方法,在大量消噪的同时,尽量避免对语音的损伤。并将单通道语音增强方法融合到两种说话人识别系统中,明显提高了说话人识别系统的性能。  5.研究了多通道语音增强方法,包括常规波束形成、波束形成维纳后滤波、线性约束最小方差波束形成(LCMV)、多通道信号子空间方法。在多通道信号子空间方法的研究过程中较为充分的讨论了多通道信号子空间方法中各个参数对算法性能的影响,通过大量的实验得出了一系列有意义的结论。并将多通道语音增强方法融合到说话人识别系统中,极大的提高了说话人识别系统的性能。
其他文献
该论文将二维OCDMA系统做为研究方向,主要的创新工作在于:1、对目前存在的三种二维光码分多址技术方案(时空/空分组合方案、波分/码分组合方案、跳频/码分组合方案)进行了比
作为985重点研究项目,"北京大学古籍数字图书馆"(RBDL,Rare Book Digital Library of Peking University)是以北京大学图书馆的特色馆藏——古文献的数字化服务为内容.该文所
该文在以下几个方面研究了数字接收机在电子战中的应用.该文首先对数字接收机进行了详细的介绍,包括数字接收机的结构形式及其优点:介绍了数字接收机中的带通信号采样、A/D转
GSM-R铁路综合数字移动通信系统是欧洲铁路联盟核准采用的标准通信平台,是一种基于目前世界上最成熟、通用的公共无线通信系统GSM平台上的,专门为满足铁路应用而开发的数字式
本文论述了图像处理在干涉条纹自适应控制中的应用。和已有的机电反馈控制方法、半导体激光器反馈控制方法、光学双稳装置控制方法相比,电路较为简单,而且,简单地调节光学系统使
近年来,基于传声器阵列信号处理的语音增强技术被广泛应用于手机通讯、电话会议、智能语音交互系统等诸多领域。其中,随着球面阵广泛应用于空间声定位、声场分析及重现等三维音
扩频系统数字化能实现系统的高度集成化和小型化,因此很有研究的价值.目前,数字扩频系统有多种实现方案,其一,伴随着专用集成电路设计的成熟,推出了大规模集成扩频芯片,以及
论文首先对GSM和CDMA系统的网络规划进行了细致的分析.然后对SCDMA系统采用的几项关键技术,如上行同步和智能天线技术进行了分析和仿真,得到其对系统性能的影响,这些结论是系
摘要:信息技术的进一步改革,在现代化诸多领域以及行业内得到了广泛的运用。现阶段大多数高中学校的教室内都配备了较为先进的多媒体设备,而如何对多媒体进行有效的利用才能进一步提高高中数学教学质量,是教师以及社会重点关注的话题。采用合理的科学化的方法进一步提高多媒体技术在高中课堂中的有效性应用,能够推动数学教学的顺利开展。  关键词:多媒体;高中数学;兴趣  一、提高学生学习数学的兴趣  数学课程的特点之
该文主要在阐明短波通信的背景、短波信道的描述方法以及相关探测技术等基础上,对短波Chirp探测技术和原理、Chirp探测信号的参数提取和处理技术及方法进行了研究.对短波信道