语音识别的矢量量化技术研究

来源 :河北工程大学 | 被引量 : 20次 | 上传用户:sdn20907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别主要指让机器听懂人的语言,即在各种情况下,准确地识别出语音的内容,从而根据其信息,执行人的各种意图。语音识别中,端点检测占有非常重要的地位。在低信噪比环境下,利用短时能量和过零率很难得到精确的检测结果。因此,本文根据语音帧间相关性,引入有限状态矢量量化(Finite-State Vector Quantization,FSVQ)技术,并将其与传统的双门限比较法相结合用于语音的端点检测,且给出具体实现步骤。大量实验表明这种技术可以较精确地检测出语音端点,特别是在低信噪比环境下,该方法更为有效。目前,在语音识别技术中,矢量量化(Vector Quantization,VQ)是具有良好性能的模型训练和模式匹配技术之一。矢量量化的码本设计过程中,经典的LBG(Linde-Buzo-Gray)算法收敛速度快,但极易陷入局部最优,且初始码本的生成对最佳码本的设计影响很大。考虑到遗传算法(Genetic Algorithm,GA)是一种具有全局优化搜索能力的算法,本文提出GA和LBG相结合的GA-L算法来优化码本,从而可以有效地改善码本质量,并将其应用于汉语连续数字语音识别中。实验结果表明,GA-L算法优于传统的LBG算法。
其他文献
随着生命科学研究的不断深入,生物信息学所涉及的研究范畴也在不断地扩展。微阵列(microarray)技术作为生物信息学中极具发展前景的技术之一,得到了学者们的关注和普及,该技术
随着分子生物学和全基因组测序技术的快速发展,产生了大量的基因数据,这使得对基因家族分子进化的研究成为可能。重建基因家族进化史对解决许多基本生物学问题起着非常关键的
概念格是形式概念分析所用到的核心数据结构,已经越来越广泛地被应用到人工智能或者是数据分析等诸多领域之中。而一般的形式概念分析是基于精确的形式背景,但是在现实世界中
RDF数据查询作为从海量RDF数据中发现有用知识的技术,在数据管理领域占有重要地位。然而,现有的数据查询研究仍存在一些缺陷:传统方法主要集中在基于关键字的查询,而忽视了关
本文从分析火力发电厂动力用煤现状入手,在详细研究动力配煤技术与决策支持系统理论的基础上,提出把决策支持系统引入到动力配煤领域。以动力配煤技术和决策支持系统技术为支撑
随着身份识别重要性的不断提高,指纹识别的应用领域日益广泛:电脑识别、信用卡识别、个人通讯设备识别、考勤、考试、政府的福利发放等方面都需要用到指纹识别。指纹识别是一
语义检索作为一种新的信息检索技术,它可以在知识理解和知识推理的基础上实现对信息资源的准确、全面的检索。对语义检索的研究不仅仅在信息管理领域,还包括人工智能、互联网等
反求工程中,由三维测距仪获取的点云常常存在空洞,给后期的几何建模工作带来很大的困难。本文在已有的边界提取与曲面重建方法的基础上,提出了一种基于点模型的点云空洞检测与修
近年来,Web服务以其协议标准化、低耦合以及平台无关性的优点,在应用集成方面得到了迅猛的发展。随之而来的问题是,如何在海量的Web服务中找到合适的服务,即服务发现,已经成为Web
企业信息门户作为一种信息和应用整合模式,能够有效地整合企业的信息资源和应用系统。它为企业的员工、客户、合作伙伴等提供了一个基于Web的统一平台,在这个平台上,企业门户