论文部分内容阅读
自上世纪中叶以来,语音识别技术在不断地进步与发展。基于语音识别的系统逐渐从实验室走向人们的日常生活当中。时下流行的Siri、Cortana语音个人助手,无一不是建立在语音识别技术的基础上。与此同时,在21世纪的今天,英语作为一门国际通用语言,在国人的学习、工作和生活当中扮演着越来越重要的角色。本文为此,基于语音识别技术,利用kivy框架设计了一款跨平台的查单词的应用——语音生词本。这款软件既支持文本查询,又提供语音查询功能。从而帮助人们能够更好地学习和掌握一门外语。本文首先介绍语音识别技术的发展历程、语音识别技术在实际生活生产领域的应用,为本文所研究的语音生词本确立研究路线。在此基础上,本文按照语音信号从声带产生直到最终被识别的顺序,分别介绍了语音识别系统的组成部分,包括语音信号的产生、预处理、端点检测以及特征参数的提取。接着,针对不同的核心识别算法(DTW/HMM),分别对基于这两种不同算法的系统进行描述。对于DTW算法,对其基本原理进行深度的分析,简述了算法实现方式,并且通过分析某些特殊情况,从而提出了对算法的改进;对于HMM算法,描述了其基本的组成元素和三个基本问题。从系统的角度对HMM系统每一个模块进行分析(包括向量标注,模型训练)。并对向量标注中用到的向量量化器进行实现和改进。在讨论模型训练的过程中也对模型的选择和初始状态的设定进行了一定的分析和讨论。本文通过python编程语言分别实现了基于DTW和HMM算法的语音识别系统,并且对这两种算法得到的识别结果进行比较和分析。针对具体的应用开发和个人生词本的特殊应用背景(孤立词特定人),选取DTW算法作为核心识别算法,结合kivy这一跨平台框架,设计了一款可以同时运行于桌面端与移动端的语音生词本软件。