基于HMM的嵌入式非特定人连续英语语音识别的研究与实现

来源 :南昌大学 | 被引量 : 0次 | 上传用户:shumoljw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号是人类交流传递信息的主要途径,让机器听懂人类的语言是人类的梦想。语音识别就是一门让机器通过读入语音信号并将其转换为文本或命令的技术。经过多年的发展,语音识别已经有了长足的发展,并显示出巨大的应用潜能。语音识别的模板匹配方法有:动态时间规整算法(DTW)、隐马尔可夫模型(HMM)和人工神经网络。DTW算法适合小词汇量的特定人孤立字词识别,在进行非特定人识别时的性能不太令人满意,且识别过程运算量较大:HMM则适合较大词汇量的非特定人连续语音识别;而人工神经网络则太过复杂。由于本文是中等词汇量的连续语音识别,所以采用HMM模板匹配方法。嵌入式语音识别的应用受到日益广泛的关注,它的应用形式和应用领域不断的扩展。嵌入式技术的蓬勃发展为嵌入式语音识别应用带来了广大的市场需求,所以基于嵌入式的语音识别研究更有价值。本文对语音识别系统的相关理论进行了介绍,主要有语音预处理、端点检测、特征参数提取、模板匹配等。具体研究了MFCC特征参数提取的相关理论,短时能量和过零率相结合的端点检测方法,以及适合于嵌入式中等词汇量的语音识别系统的模板匹配方法HMM模型等。本文先将一些常用的英语句子在matlab上进行仿真,然后在ARM上进行仿真。
其他文献
人的大脑控制人的行为。当人需要进行某种行为时,在大脑中就会产生一定的思维活动,经过神经传递给相关肌肉组织,由肌肉收缩产生相应的动作,这就是运动的过程。然而,有些患者
随着科学技术的发展,立体显示技术引起人们的关注,逐渐成为热门的研究领域之一。国外立体显示技术应用日趋广泛,显示技术也呈现多样化,但核心技术仍然被国外某些研究机构所垄断。
矿井无线传感器网络定位系统作为感知矿山物联网的重要组成部分,担负着矿井人员和设备的实时定位,以及指导灾后搜救等重要任务,是保证煤矿安全生产的重要途径和手段。但无线传感
中国移动多媒体通信(CMMB)是中国数字广播电视的移动接收标准。CMMB系统采用正交频分复用(OFDM)技术作为其实现方案。OFDM可以实现高数据传输速率,高可靠性,并且能够有效避免
监控系统中摄像机系统的标定,目标检测与跟踪一直是该领域中基础也是十分重要的两个组成部分与研究领域。随着监控系统朝着大型化与智能化方向发展,所需要的摄像机数目越来越
介绍了低压铸造技术采用电磁泵充型和保压,对电磁泵发展背景、基本原理及相应低压铸造设备的结构进行了一定的论述。通过生产验证,电磁泵技术适于低压铸造,是一种很有发展前
在线制作协同环境能够满足广大互联网用户对基于音视频的强交互性应用的需求,丰富新一代高可信网络上的多媒体业务,它是一种基于广域网和浏览器的在线多媒体交互平台。本文所
当今时代信息技术的快速发展带来的是宽带需求的不断提升,大数据、视频、电信化应用等业务的出现或普及使得传统通信管道面临日益巨大的压力。随着上一代100G传送网络的成熟
多媒体技术的迅速发展给人们的生活方式和工作方式带来了巨大的改变。图像数据的巨幅增长也使得图像检索技术成为国内外的研究热点。传统的方法是利用人工标注来实现图像检索
进入21世纪,随着改革的不断深化,档案工作也随之发生了变化.面对新时期档案工作的需要,如何做好档案管理工作,本文对此加以论述.
期刊