论文部分内容阅读
语音文件检索技术,可以有效地帮助人们从海量的语音信息资源中找到与自己需求相关的信息,是解决信息爆炸问题最有效的技术手段。随着语音识别技术的不断发展,将语音识别技术与传统的文本信息检索技术相结合来进行语音文件检索已经成为一个趋势。然而,语音识别系统的效果,将严重影响语音文件检索的性能。在大多数情况下,由于模型不匹配或者语料噪声的影响等,使得语音识别的效果往往不能令人满意。针对如何将语音识别技术与信息检索技术有效结合这一问题,本文从语音文件的表示形式及信息检索模型两方面进行考虑,提出了一种新的中文语音文件检索方法。一方面,对于语音文件的表示形式,采用Syllable-lattice结构。Lattice可以提供语音识别的多候选结果,它能够一定程度上减轻语音识别的误识对信息检索系统的影响。同时,基于子词的索引策略—Syllable(音节),可以有效地解决查询请求中的OOV词的问题。另一方面,对于信息检索模型,本文研究了信息检索相关技术,在传统的查询似然信息检索模型中引入了文件长度先验概率。实验表明,基于Syllable-lattice的检索系统的检索效果大大优于传统的One-best,其中,在信息检索模型中引入文件长度先验概率信息,可使基于Syllable-lattice的语音文件检索系统的检索效果达到最优,比基线检索模型提高了约30%。实验证明了所提方法是正确的、可行的、有效的。