一种基于数据筛的音频视频连续语音识别系统

来源 :计算机应用 | 被引量 : 0次 | 上传用户:aridan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文中考虑语音的音频和视频双模型特性,建立了一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统.在视频特征提取方面,引入了一种鲁棒性较好的数据筛特征提取方法;在音频和视频集成建模方面,使用多数据流HMM来反映语音的双模型特性.识别实验表明,文中建立的音频视频连续语音识别系统具有很好的抗噪性.
其他文献
高校图书馆是每一所大学的学习支持中心、科研支持中心、文化交流和传承中心。由图书馆邀请专家学者举办的各类讲座,为广大师生读者的学习、科研、文化熏陶提供了多元化的途
胶质瘤是最常见的中枢神经系统肿瘤,因中枢神经系统存在血脑屏障、不同的组织构成等,造成了不同于其他器官的组织环境,而这些环境似与胶质瘤的发生、发展密不可分。为了改善
都市水墨是以传统的水墨画表现技法及意境来描摹现代人的都市生活的一个艺术类型。自上世纪80年代诞生至今,已走过三十年的发展历程,其间产生了不少著名画家。本文即以两位著
《增广贤文》作为蒙学经典,是古人留下的珍贵教育遗产。从生态翻译学的角度出发,对《增广贤文》赵彦春英译本的翻译生态环境和英译策略进行探讨,从语言维、文化维、交际维剖
网络区分服务(D iffServ)中,为了在确保传输逐跳行为(AF PHB)中实现多个丢弃优先级,将随机早期检测(RED)变体为多级随机早期检测(MRED)形式。文中主要研究加权RED(WRED)和R IO-C(RED with In/Out and Couple queue)两种MRED机制及其在不同参数设置方式下对低丢弃优先级数据流的保护能力。使用NS2(Network Simulation
基于影像特征级数据融合的遥感图像重构是在突出目标地物的空间结构和纹理特征情况下的信息融合。在数字图像小波多分辨率分析理论基础上,采用小波变换方法对高分辨遥感图像的目标地物边缘进行信息增强,然后与多光谱遥感图像进行特征信息融合。在融合过程中,首先对多光谱图像中的R、G、B三个波段的图像进行小波分解,得到相应的低频图像,然后对特征增强后的高分辨率图像进行小波分解,再将分解后的高频图像分别与低频图像进行
递进网格模型可用于实现层次细节模型、网格模型的递进传输等。文中提出并实现了一种支持全特征的递进网格模型生成算法。该算法可生成带有颜色、纹理等附属信息的递进网格模型 ,且所占空间小 ,运行速度较快
利用多包接收的方法和跨层设计的思想,提出一种基于IEEE802. 11接入控制策略中的RTS/CTS机制,来实现无线AdHoc网络媒体接入的算法,并对新算法进行了理论分析和仿真。分析结果表明与传统的RTS/CTS机制相比,该算法有效地提高了无线AdHoc网络的吞吐量。
主题词在信息处理和信息检索过程中有广泛的用途 ,然而大量网页没有主题词 ,手工抽取主题词是一个繁重的过程。可以将主题词自动抽取看作是分类问题 ,充分利用网页的结构信息并且使用有监督的机器学习方法来自动地抽取网页中的主题词。试验结果表明该算法具有实用的价值
网上旅游正在成为实地旅游的重要补充形式。摄像头在线直播开放视频网上旅游资源具有网络、摄像头和旅游方面的特点与优势。文章以亚平宁半岛、伊比利亚半岛和巴尔干半岛的10