论文部分内容阅读
本文主要研究了语音检索相关的核心算法,从词汇无关的快速关键词检测入手,分别研究了基于GMM和TRAP-NN框架下语音搜索的基本方法,以及基于词图的语音搜索算法,并提出了相应的索引和检索方法。在此基础上,实现了一个实用的语音检索系统。
论文工作的主要内容和贡献如下:
_改进了基于声学GMM模型的关键词检测算法,提出一种新的基于音素矩阵的词汇无关快速关键词检测方法,在损失较少的检测准确率前提下,大幅度提高检测速度;
■研究了基于TRAP特征和NN声学模型的音素识别器,在此基础上提出了基于TRAP-NN框架的快速关键词搜索算法,与GMM快速检测方法的准确率相同,声学训练语料是GMM的1/5,索引生成速度是GMM方法的3倍;
■研究了基于词图的关键词搜索算法,以及混淆网络和改进的词图转音节图的搜索方法,部分解决了汉语词图的集外词问题,搜索准确率比纯声学方法有明显提高,并提出了一种双音节索引方法对拼音图进行索引,在存储消耗上满足了语音检索的要求;
■基于以上提出的语音检索核心算法,设计并实现了一个完整的语音检索系统,解决了海量语音处理、海量索引存储管理、检索接口等系统问题,达到了实用要求。