基于Lattice的关键词检出系统研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:robert_xt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于大词汇量连续语音识别(LVCSR)的关键词检出是关键词检出领域的重要研究方向。为了给出足够的候选,提高检出的正确率,普遍采用网格(Lattice)作为中间结构方式。但由于Lattice结构不适合高效地从中提取所需信息,检出性能并没有期盼的那样好。因此,如何在LVCSR的结果Lattice中,对关键词进行高效地解码,成为该领域的研究热点。针对这一问题,研究人员提出了用混淆网络优化Lattice的方法,并将其应用于关键词检出系统当中。混淆网络的思想是,对Lattice中所有候选路径动态对齐,把竞争同一发音位置的词假设形成一个集合,然后把这些集合按时间顺序连接起来,再从每个集合中挑选最可能的候选,形成最佳词串。本文在现有的混淆网络生成方法的基础上,提出了一种更加适合于关键词检出的关键词混淆网络生成方法。该方法只对关键词竞争候选生成带有得分标记的关键词混淆网络,突出了关键词候选之间的竞争关系,最小化了关键词错误率,有效地保证了关键词的正确识别。这种方法实现简单,消耗时间少。实验结果表明,当基于N-best的关键词检出系统的召回率为62.89%时,基于混淆网络的关键词检出系统的召回率为87.11%,提高了24.22%。证明所提出的基于关键词混淆网络的生成方法是正确的、可行的、有效的。
其他文献
多接口多信道WMN(无线mesh网)作为下一代无线网络接入的一项关键技术,已成为了当前的研究热点。其中对网络吞吐容量的改善问题是一项重要工作。本文针对网关部署以及网络拓扑
数字电视技术是上个世纪末新兴的几大技术之一,数字电视技术的进步极大地推动了数字电视相关产业的发展。随着多种多样数字电视业务的开展,对数字电视信号的监测显得越来越重要
MIMO-OFDM系统的比特及功率分配算法采用自适应技术能够动态地调整系统参数,充分利用信道资源,提高系统的性能。然而,传统的分配算法虽然系统的性能较优,但存在着算法复杂度高,系
蜂窝网具有覆盖面积广、切换时延小、连续性强等特点,目前越来越多的移动终端数据通过蜂窝网传输,因此蜂窝网负载能力需要进一步提升。已完成部署的LTE,其带宽、稳定性不能完全
表面电位计可测量带电体的表面电位,测量电荷量大小,它是静电复印、静电印刷、静电记录等研究或生产单位必备的仪器。在有些生产过程中可用来连续测量制成品的静电电位,以控制产
煤矿安全是当前安全生产工作的重中之重,而煤与瓦斯突出是煤矿中一种极其复杂的动力现象,是威胁煤矿生产的严重自然灾害之一。鉴于其影响因素众多而突出机理尚未彻底研究清楚、
随着信息产业的飞速发展,通信技术和计算机技术的融合已成为必然趋势,因特网的普及加速了这两种技术的融合,使得全球通信产业呈现出移动化、宽带化、IP化的趋势。基于IEEE802.16