论文部分内容阅读
语音识别(Automatic Speech Recognition,ASR)是人工智能领域里一个重要的研究方向.对于如何实现语音识别,将语音序列转化为文本序列,简单来说就是确定问题,选择一个模型之后再训练它.随着开源社区的不断扩大,加速了语音识别领域的研究进程,一些语音识别开源工具例如CMUSphinx、Julius、HTK、CMUSphinx、ISIP等也陆续兴起,被研究者们广泛运用.本文首先将介绍目前可以开发语音识别的工具CMUSphinx,Kaldi以及深度学习平台;然后简述CMUSphinx开源工具的实现流程;其次讲述运用Kaldi的语音识别实践过程;最后总结在语音识别实现中的一些问题以及未来的研究方向.