音频内容检索技术研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:xiawayu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究了语音检索相关的核心算法,从词汇无关的快速关键词检测入手,分别研究了基于GMM和TRAP-NN框架下语音搜索的基本方法,以及基于词图的语音搜索算法,并提出了相应的索引和检索方法。在此基础上,实现了一个实用的语音检索系统。   论文工作的主要内容和贡献如下:   _改进了基于声学GMM模型的关键词检测算法,提出一种新的基于音素矩阵的词汇无关快速关键词检测方法,在损失较少的检测准确率前提下,大幅度提高检测速度;   ■研究了基于TRAP特征和NN声学模型的音素识别器,在此基础上提出了基于TRAP-NN框架的快速关键词搜索算法,与GMM快速检测方法的准确率相同,声学训练语料是GMM的1/5,索引生成速度是GMM方法的3倍;   ■研究了基于词图的关键词搜索算法,以及混淆网络和改进的词图转音节图的搜索方法,部分解决了汉语词图的集外词问题,搜索准确率比纯声学方法有明显提高,并提出了一种双音节索引方法对拼音图进行索引,在存储消耗上满足了语音检索的要求;   ■基于以上提出的语音检索核心算法,设计并实现了一个完整的语音检索系统,解决了海量语音处理、海量索引存储管理、检索接口等系统问题,达到了实用要求。
其他文献
异构双腿行走机器人(Biped Robot with Heterogeneous Legs, BRHL)是一种将双腿机器人和智能假肢结合起来研究的新型机器人模式。它模拟膝上截肢患者安装智能假肢的情形,可以
从一幅图像中分割出具有“网络”形式(即相交在交点的分支)的对象,这一问题来自多个领域的应用要求。例如,遥感图像中道路和河流网络的分割,以及医学图像中血管网络的分割。从遥
学位
智能交通系统(ITS)被公认为是解决道路交通问题最有力的手段之一,而动态交通信息是ITS实施的基础。本文围绕道路交通信息获取这一主题,对自动化交通参数和交通事件检测所涉及
路径规划是移动机器人完成任务的安全保障,同时也是移动机器人智能化程度的重要标志。在机器人硬件系统的精度短期内不能得到解决的情况下,对路径规划算法的研究显得尤为重要,这
当今世界和平与发展是主题,但是危害人民生命财产安全的恶性事件时有发生。特别是2001年美国“9·11”事件后,国际社会恐怖活动更是愈演愈烈。为了满足打击恐怖分子、消除恐怖
优化问题是机器人在动态非结构环境下进行决策的关键问题之一。但是,优化算法通常具有较高的计算时间复杂度,尤其是在包括多种动力学约束的情况下,这限制了其在实时系统中的应用
学位
身份认证是保证网络安全的一种有效机制,基于密码学的身份认证系统对安全性及可用性有较高的要求。由于网络的开放性,新的和未知的攻击不断涌现,人们很难检测和防御所有这些攻击
随着网络技术的飞速发展,特别是无线网络技术的发展使人们空间的距离大大缩小。在现代化住宅小区,人们对居住环境的要求,正从以往追求居室的宽大和装饰豪华向追求安全、舒适和智
本文以大气层内直接侧向力与气动力复合控制的鸭式布局防空导弹为研究对象,针对系统的非线性、通道耦合,基于动态逆控制方法,设计了复合控制律,以实现系统快速响应。对于侧向
极端环境遥操作机器人作为一种人机协作系统,不仅延伸了人类的操作能力,还可以把人类从危险或者未知的极端工作环境中解放出来,因此长期以来都是机器人领域的研究热点。但是在极