基于SVM的含噪耳语音说话人识别研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:daregooo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
耳语音作为一种特殊的语音,是日常语音交流必不可少的一部分。随着说话人识别技术的日益成熟以及人们对耳语音关注程度的增加,耳语音说话人识别技术在信息服务、司法鉴定等方面正发挥着越来越重要的作用。  耳语音的发音方式异于正常音。它具有以下特征:没有基频;共振峰向高频部分偏移;信噪比较低,易受噪音等污染。因此在耳语音说话人识别系统中,对其进行增强处理以及提取能准确反映其声学特性的特征参数是研究的关键。本论文主要针对这两点进行探讨。  在语音增强方面,由于本文使用的耳语音库是在普通实验室环境下建立的,存在诸多干扰因素,所以在预处理阶段必须进行增强处理。考虑到常用的耳语音增强算法——基于神经网络的语音增强算法以及自适应滤波算法的不足之处,本文选择基于子带功率谱熵的改进谱减法进行增强处理。  在特征提取方面,针对耳语音共振峰的偏移以及人耳对耳语音共振峰敏感区域的改变,本文介绍了几种修正的MFCC参数,并将其应用于耳语音说话人识别实验中。  本文具体工作如下:  (1)建立了一个包含31个说话人的小型耳语音库。  (2)分析了不同环境和不同信噪比下含噪耳语音的子带功率谱熵图,证明子带功率谱熵可以较为准确的反映含噪耳语音信号。并采用基于子带功率谱熵的改进谱减法对含噪耳语音进行增强处理,经实验证明此方法增强效果良好。  (3)与正常语音相比,人耳对耳语音共振峰敏感区域发生了改变,因此需要修正传统的MFCC参数。文中介绍了几种通过修改Mel滤波器组得到的修正MFCC特征参数——MFCCM、MFCCExp-Log和耳语音敏感尺度系数(WSSC),并详细介绍了相对谱——感知线性预测(RASTA-PLP)参数。  (4)提取上述特征参数进行基于SVM的耳语音说话人识别实验,实验结果证明,24阶WSSC参数与RASTA-PLP参数的组合可以使识别效果达到最佳。
其他文献
移动增值服务平台是移动运营商和移动服务提供商之间的接口,是一个集成的中间件平台。从移动增值服务平台的体系结构和各种标准通信协议出发,深入研究了通信模块、业务模块、
随着计算机网络应用日益普及和通信技术、计算机计算的发展,同时越来越多的企事业单位在单位内部开始使用IP电话,网络接入服务器(NAS)认证计费系统已经成为远程接入设备的一
在现有的分布式网络安全系统中,入侵检测与防火墙通常是联动工作的,这种方式能有效防止黑客袭击,但是随着网络病毒攻击、黑客袭击方式的“集成化”,现有的分布式网络安全系统
虚拟企业是二十一世纪的一种新型的企业形式,它通过计算机网络把分布在不同地理位置上的企业集成起来,虚拟企业自身的特点决定了虚拟企业的信息系统和传统企业的信息系统有所不
云计算是一种以有偿提供资源作为服务的商业化计算模式,其中,如何根据集群负载与用户服务水平,对资源进行合理、有效的分配是云计算研究的重要内容,但目前该领域还存在如资源使用
软件构件化是21世纪软件工业发展的大势趋,构件化思想在软件领域被广泛地应用。把网络协议结和构件思想结合在一起实现是目前网络协议体系结构发展的方向,特别是在基于通信设备
学位
随着Internet在我国广泛应用,远程教育越来越受到人们的重视。远程教学不仅仅是将教学材料在网上发布,更多的是学生与教师、教师与学生之间的充分沟通、交流。由于远程教学中教
随着信息技术的飞速发展,人类在信息处理领域面对更多新兴应用的挑战,特别是随着空间地理信息、时间信息的存储和管理的广泛应用,原有的空间数据库和时态数据库都越来越体现
目前高性能计算机和高性能服务器已逐渐使用大规模集群结构。集群文件系统是集群的一个重要组成部分,作为一种集群体系结构上的并行文件系统PVFS(Parallel Virtual File Syst