噪声环境下说话人识别研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:lullm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会信息化程度的发展,越来越多的场合需要对人的身份进行可靠地识别,传统的以密码方式进行身份认证的技术日益暴露出很多弊端。为确保信息安全,用人特有的生物特征作为认证手段的技术逐渐发展起来。说话人识别属于生物认证技术的一种,是一项根据语音波形中反映的说话人生理和行为特征的语音参数自动鉴别说话人身份的技术。随着计算机技术发展,说话人识别技术越来越受到人们的重视。在说话人识别技术中,关键在于两方面:其一,如何从数据量相当大的原始语音信号中提取出反映说话人个性特征的参数。其二,设计出行之有效的分类器。说话人识别虽然研究历史较长,但仍有许多问题有待研究解决,噪声环境下的说话人识别即是其一。在纯净语音环境下的说话人识别系统已经有很高的识别率,但是在噪声环境中识别率显著降低。为了提高说话人识别系统的在噪声环境中的识别率,本文考虑到小波变换的优点,结合具有较好鲁棒性的特征参数GDS(group delay spectrum),提取基于小波变换的GDS特征参数。对于分类器的设计,主要应用矢量量化的技术。通过不同噪声在不同信噪比下的实验来验证提取参数的有效性。本文首先介绍了说话人识别技术的研究背景和应用领域,概要介绍了说话人识别技术。接着对说话人识别技术中常用的特征参数进行了性能研究,通过实验比较了它们的鲁棒性。针对噪声环境下,提出了新的组合特征参数,并详细介绍了特征参数的提取过程。然后给出了分类器的设计方法。最后,根据提出的方法实现了说话人识别系统。
其他文献
Internet是目前全球规模最大的计算机通信网,它的范围遍及全球几乎所有的地区。WWW(Word Wide Web)是一个大型的分布式超媒体信息数据集合,它的出现极大地推动了Internet的发
随着Internet的快速发展,人们越来越关注如何更好地为用户提供个性化和增值服务,由此业务选择网关应运而生。当前市场上的业务选择网关都是面向网络运营商的粗粒度的设备,而
随着网络规模的日益扩大和网络信息的逐渐增加,一些大型的组织机构中应用系统比较多,这些应用系统由于开发的时间和背景不同,相应的平台和技术架构也不一样。这样就会出现每
图像的大部分信息都是从图像边缘感知的,人们观察一幅图像时首先认识到的是图像中物体的形状也就是边缘信息。边缘包含着图像中多种有用的信息,它是图像最基本的特征。边缘检
随着信息技术的飞速发展,特别是计算机互联网络和移动通信技术的推广应用,人们获取、交流和处理信息的手段发生了巨大变化。网络带来方便的同时,信息的安全性也日益严峻,信息在网
高强度激光通过非线性介质时,因受上游光学元件上的污点或缺陷等模糊斑调制,在下游会导致非线性热像的形成,热像强度可能达到光学元件的损伤阀值,从而造成元件的损坏。系统研究强
随着Internet技术的不断发展,企业对于信息的依赖已经到了前所未有的程度,信息化的快慢直接决定着企业的前途和命运,企业级Web应用的需求随之日益增多。为此企业级应用系统的多
微生物群体中包含着大量诠释人类健康、自然进化和生态构成等问题的重要信息,高通量测序技术使获取这些信息成为可能。通过对微生物群落的样本数据进行测序,产生了大量的宏基
随着数字化影像设备在医学领域中日益广泛的应用,医院每天都要产生大量的数字图像。如何有效地进行数字图像的管理,是实现计算机辅助诊断,达到“无纸化、无胶片化”的信息化
汽车是现代人类最重要的交通工具,是现代文明的标志。汽车的普及为人们的工作和生活带来了很多便利,但是随着社会和经济的发展,车辆越来越多,交通越来越拥挤,交通阻塞和车辆的失窃