论文部分内容阅读
本文采用现代信号处理的方法即小波变换和希尔波特黄变换的经验模式分解,对大词汇量汉语连续语音识别系统中若干问题进行了研究。
本文的大词汇量汉语连续语音识别系统主要由三个开源工具构筑而成:声学模型的训练采用英国剑桥大学的HTK工具包、语言模型的训练采用卡内基梅隆大学的CMU-CamToolkit统计语言模型工具包、识别器采用日本京都大学和日本IPA(Information-technologyPromotionAgency)联合开发的一个日语大词汇量连续语音识别引擎。
本文提出的二次小波变换降噪方法先对信号进行小波变换,然后对重构后的信号再进行一次变换,最后进行阈值量化处理。本文提出的SWT降噪法能更有效去除掉语音信号中的加性噪声。此外相比EMD+CWT的降噪方法,EMD+SWT的方法也能更有效的去除掉语音信号中的加性噪声。