【摘 要】
:
说话人识别是指通过说话人的语音来自动识别说话人的身份,作为生物证认技术的一种,它在许多领域里有着良好的应用前景和巨大的市场潜力。本文通过分析说话人识别的原理与系统
论文部分内容阅读
说话人识别是指通过说话人的语音来自动识别说话人的身份,作为生物证认技术的一种,它在许多领域里有着良好的应用前景和巨大的市场潜力。本文通过分析说话人识别的原理与系统结构,和参考现有的语音识别的技术,研究了语音特征提取过程和识别方法,对语音特征提取进行了改进,并取得了很好的实验结果。本文针对汉语语音中的单韵母元音,分割并提取出有声段,再对每个元音按短时能量从低往高提取出一组短时信号,然后再对组信号计算出MFCC。在模式识别中,采用矢量量化和隐马尔可夫模型分别对每一个元音建模,将匹配的结果按设定的逻辑进行判决。本文研究了矢量量化和隐马尔可夫模型在语音识别中的原理和方法,主要研究工作如下:(1)分析主要的语音特征的特点,研究了基于VQ和HMM模型的语音识别的的特征参数提取方法。(2)探讨基于VQ和HMM模型的识别方法的原理,分析了识别的过程,寻找能够简化识别模型和提高识别率的方法。(3)通过研究和实践,基于对元音信号分别建模的方法,对MFCC的提取过程进行了改进,并应用到语音识别当中。最后对实验结果分析和总结。
其他文献
我国是地震多发国家。地震活动频度高、强度大、分布范围广、震源浅,地震灾害十分严重。由于引发地震的因素很多且各种因素之间具有极不确定的非线性关系。本文通过时间震级
在组合优化问题中,车辆路径问题(Vehicle Routing Problem)属于比较典型的NP-Hard问题。一般情况下组合问题可以模式化为排序问题与分类问题,然而VRP则同时具备排序与分类这两
在这个信息爆炸的时代,信息检索系统的出现无疑给人们在因特网上寻找自己感兴趣的内容提供了莫大的帮助。对于系统返回的大量文档来说,用户们最关注的就是这些文档的顺序。一个
在传统的信息检索中,检索模型是在静态数据集上训练得到的,模型一经训练,结构和参数都相对固定下来,没有根据新的数据自动修正的机制。但现实中,Web上的信息是实时更新的,经
智能卡的名称来源于英文名词"Smart Card",智能卡属于IC卡(集成电路卡)的一种。它是一种带有微型CPU处理器和存储器等微型集成电路芯片且具有标准规格的卡片。由于智能卡具有
计算机程序设计是一种抽象且调试成本较高的过程,需要功能丰富和高效的可视化开发工具及环境的辅助。目前的主流开发工具只是在设计过程提供了静态可视化功能,而在调试过程缺
排课问题对于每个学校的教务管理来说都是非常重要的,现在是信息的社会,在学校的教务管理中实现排课的智能化,可以快速高效的对课程进行编排,对整个学校的教学体制的管理具有
万维网是一个巨大的、分布广泛的、全球性的信息服务中心,它涉及到人们生活中的方方面面。人们不再对网站、网页这些名词感到陌生了,政府机关、高校、公司都搭建了自己的网站,而
面向服务的架构(Service-Oriented Architecture,简称SOA)是指为了解决业务集成的需要,通过连接能完成特定任务的独立功能实体实现的一种软件系统架构。SOA是一个组件模型,它
随着网络规模的日益增大,网络结构也异常复杂,现有的入侵检测系统很难适应大规模分布式网络的安全需要。免疫系统以其在信息处理中所表现出来的分布式保护、自适应性、鲁棒性、