论文部分内容阅读
汉语语音识别的基本单元一般为音素、音节以及声韵母.以声韵母为基元的识别系统由于HMM模型较少,计算量小,适合于实时实现.但是由于模型比较孤立,对语音信号的声学特性描述得不够精确,因而识别率一般比音节基元的系统低.而以音节、音素(tri-phone、di-phone)为基元的系统则有HMM模型数量多、训练和识别过程中计算量大的缺点,影响到系统的实时性.本文提出了一种折衷的方案,系统基元仍选择声韵母,而在HMM训练阶段,对整个音节序列的参数进行运算,使声韵过渡段的状态得到平滑,同时计算并保存每个音节声韵之间的