基于快速沃尔什变换的藏语音识别技术

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:icefireren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
藏语音识别技术由于研究的起步较晚现在还处于初级阶段,且使用人口众多,能促进藏族同胞与外界的学习交流,影响到民族团结和国家稳定,所以对藏语音识别技术的深入研究和识别系统的广泛应用具有重要意义。对于藏语音孤立词识别而言,当语音库逐渐扩充的时候,识别速度将越来越不能满足实时性的要求,对孤立词识别系统的实际应用造成很大限制。为了解决这个问题,将快速沃尔什变换应用到提取MFCC特征参数中,使提取和计算特征参数的时间大为缩短,有利于识别系统实时性的实现。对于连续藏语音识别而言,如何准确的将其分割成可供识别用的藏语音单元是进行连续藏语音识别的重要前提。首次将基于小波变换的两次筛选和MFCC_FWT的分割算法应用到连续藏语音的分割中,将连续藏语音分割成孤立的语音单元后再进行识别。主要工作和贡献如下:1.对藏语的发音特点和藏语句子的句法特征进行了分析,介绍了藏语音识别系统的基本原理,对预处理和端点检测技术进行深入研究。2.对MFCC的特征提取算法进行介绍,并根据其在实际使用中计算速度不尽人意的问题将快速沃尔什变换应用其中,改进后提取MFCC的速度得到很大提升,并且能保证提取参数的有效性。3.对DTW和HMM两种识别算法分别进行分析并应用到中等词汇量藏语音孤立词识别系统中。DTW算法对特定人的孤立词识别简单有效,HMM算法具有极强的建模能力,可以方便的表征任何语音基元,对孤立和连续的藏语音都具有很好的识别效果。4.首次将基于小波变换的两次筛选和MFCC_FWT的分割算法应用到对连续藏语音的分割中,将连续藏语音分割成孤立的藏语音单元后再进行识别,大大简化了连续藏语音识别系统实现的难度。
其他文献
数字图像通信系统对信息的存储、传输和处理的要求非常高,一方面图像的数据信息量非常大,另一方面恶劣的无线信道环境使得信息在传输过程中产生大量的误码,因此在保证传输质
烟幕作为至今最为原始但仍被广泛使用的干扰源,己成为现代军事战场中十分有效的干扰手段。因此,烟幕的建模仿真已经成为了一个重要的研究课题。本文采用连续点源浓度分布高斯
太阳光经过大气分子和粒子的散射作用就会变成偏振光,不同偏振态的偏振光就形成了蕴含着丰富信息的大气偏振模式。自然界很多昆虫能够利用复眼中的小眼阵列检测天空中的偏振
随着信息化时代的来临,计算机科学的进步以及手机的智能化,二维条码越来越多地被应用在各行各业中。QR码作为第一种直接对非英文字符进行编码的二维条码,因其独特的编码特性
随着医学技术的发展,尤其是在计算机技术、电子技术、数字信号处理技术等领域不断地发展,生物医学信号模拟器也在不断地发展。它是一种生物医学检测设备,其功能是对多参数监
随着通信技术的日益发展,近年来,空间激光通信,已成为光通信研究的热点。大气湍流效应严重影响大气激光通信系统的性能,使误码率增加。研究表明误码率随湍流强度的增加而上升
3GPP提出长期演进项目(LTE),目标是设计一套通信速率更高、时延更低、系统容量更大宽带化、分组化移动通信系统,来满足通信市场的高速率数据业务和低时延通信业务。为了保证
低轨卫星通信具有信号传播延时小和路径损耗小的特点,可以方便地实现全球任意位置的移动通信,已经成为当前移动通信领域的研究热点。本文将围绕低轨星载卫星通信中的智能天线
目前,在计算机通信、雷达监测、航空航天等诸多领域都广泛地使用着各式各样的数据采集系统和数据存储系统。随着半导体、微电子等技术的不断发展,存储介质也在不断的更新。从