论文部分内容阅读
通过语音识别实现装置的控制是近年来的研究热点,具有广泛的应用前景。语音识别使得计算机能以方便、自然、快捷的方式听懂人类的语言,尽管目前语音识别技术已取得了巨大的进展,但是在识别率、实时性等方而仍然存在较大不足。护理床翻身动作的语音控制模式采用语音识别技术实现护理床翻身动作的语音控制。本文在分析语音识别过程的基础上,深入研究了基于模糊聚类算法的语音信号端点检测门限闽值的自动获取方法,并通过主成分分析法(Principal Component Analysis, PC A)对语音信号的特征数据集进行降维,从而使得在采用隐马尔科夫模型(Hidden Markov Model, HMM)算法进行语音识别过程中的训练时间大幅度缩短。本项目得到广东省科技计划项目“低成本的多功能护理及生理参数远程监护装置”(项目编号:2010A030500006)和佛山市科技计划项目“多功能护理机器人”(项目编号:FZ2010013)的资助。首先,本文介绍了研究内容的相关背景知识和研究意义;分析了护理床翻身动作控制的研究现状、语音识别研究现状、语音信号端点检测现状和语音信号特征降维的现状。其次,本文对语音信号的特征数据进行预处理,主要包括语音信号预加重和语音信号端点检测。针对语音识别环境存在背景噪声影响端点检测的问题,在分析各种端点检测方法的基础上,本文采用模糊聚类算法计算不同语音命令的端点检测门限值,使端点值与噪声相匹配,从而提高语音端点检测的准确率。然后对端点检测出来后的语音进行梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients, MFCC)特征参数提取,为后面的语音识别提供有效的语音信号特征数据。第三,在分析比较动态时间规整(Dynamic Time Warping, DTW)和HMM语音识别原理的基础上,根据护理床翻身动作语音控制系统的语音识别对象为非特定人的实际情况,选定HMM作为护理床翻身动作语音控制的语音识别算法。第四,针对MFCC语音特征存在数据冗余、维数高导致HMM模型训练时间长的问题,本文设计了基于PCA的HMM语音识别算法,通过用PCA降维方法对MFCC语音特征数据进行降维,保留MFCC语音特征中的主要成分,再用HMM算法进行语音的训练和识别,从而达到在确保语音识别率的前提下提高语音识别实时性。第五,设计了护理床翻身动作控制系统,采用Visual C#与matlab混合编程的方式开发了护理床翻身动作的语音控制系统。第六,对本文设计的语音识别算法进行了实验并对护理床翻身动作语音控制系统进行了调试。实验结果表明:(1)采用基于模糊聚类算法的端点检测方法,在有背景噪声的情况下有效地提高了语音断点检测的准确性。(2)通过对语音信号特征进行PCA降维在保证语音识别准确率基本不变的前提下有效的减少了语音训练的时间,调高了语音识别的实时性,取得良好的识别效果。最后,本文对所进行的工作进行了总结,并给出了后续研究的建议。