基于多帧融合的视频文本检测

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户：coralcn

【摘要】

：

视频文本能够提供重要的视频语义信息以供视频检索和视频摘要,因此获取视频文本对于视频语义分析具有重要作用。有效地检测出视频中的文本无疑是其中一项关键的技术。文本检

【作者】

：

孙小亮

【机构】

：

北京邮电大学

【出处】

：

北京邮电大学

【发表日期】

：

2011年01期

【关键词】

：

文本检测多帧融合多帧验证

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

视频文本能够提供重要的视频语义信息以供视频检索和视频摘要,因此获取视频文本对于视频语义分析具有重要作用。有效地检测出视频中的文本无疑是其中一项关键的技术。文本检测最主要的困难来自复杂背景的存在。通过文本检测方法减小复杂背景的干扰,检测出视频文本图像是本文主要解决的问题。基于静态图像的文字检测和识别方法基本上都不能很好地解决复杂背景带来的干扰。针对视频中文本背景复杂、干扰强烈等问题,在对前人相关工作进行分析、研究的基础上,本文提出一种基于多帧融合的视频文本检测方法。该方法首先采用信息熵和角点信息分析相结合的方法对视频进行镜头分割,将视频分割成较小的语义单位,提高系统处理效率；然后,在基于静态图像检测到的文本区域的基础上,利用多帧验证方法确定文本区域以及文本所在的帧序列；最后,对帧序列中的文本块进行多帧融合,降低文字区域的背景复杂度,以减小后续文本定位、文本提取等过程的处理难度。本文提出并实现的基于多帧融合的文本检测方法在视频文本提取系统中得到成功的应用,使该系统完整地实现了从输入视频到产生OCR识别结果的总体流程。实验结果表明,本文提出的文本检测方法具有较高的准确率和处理效率。

其他文献

面向融合网络的ParlayX网关设计与实现

三网融合已被正式提上日程,基于融合网络提供融合类业务也已是迫在眉睫的任务。本文所提出的面向融合网络的Parlay X网关(PXGW),正是基于这个网络和业务环境背景而提出的,目

学位

融合网络开放业务接口网关Parlay XWeb Service

基于混沌映射的分组密码研究

网络安全问题是下一代互联网研究的关键问题之一,而加密算法又是网络安全问题的核心。为了满足下一代互联网多媒体实时性安全通信的要求,既需要选用复杂性高的加密算法,以增

学位

混沌SP分组加密S盒P盒安全分析

LTE无线接入网自主负载均衡管理方法研究

随着网络节点数量的增多、用户对网络服务质量的要求越来越高,无线接入网变得庞大且难以管理,网络优化成本较高。LTE (Long Term Evolution)无线接入网具有自主管理的设计需

学位

自主网络管理负载均衡LTE无线接入网用户移动性模型

IMS网络中多媒体彩铃业务的改进与融合

随着3G(3rd-generation)及后3G无线通信技术的成熟和发展,使得视频通信业务成为可能,人们也越来越期待能在手机智能终端上享受更多丰富多彩的业务,比如互联网业务。随着呼叫

学位

IMS多媒体彩铃业务早期媒体类业务业务融合

基于实例推理的雷达辐射源识别研究与应用

雷达辐射源信号识别是电子情报侦察(ELINT).电子支援侦察(ESM)和雷达威胁告警(RWR)系统中的关键处理过程,也是电子干扰的前提和基础,其识别水平是衡量雷达对抗设备技术先进程

学位

CBR雷达辐射源识别划分方法模糊理论

基于地理信息的WSN节能路由算法研究

无线传感器网络(wireless sensor network, WSN)由部署在监测区域内大量的、微型的传感器节点组成,其目的是协作地感知、采集和处理监测区域内感知对象的信息,并发送给观察者

学位

WSN路由算法GDDRGEER节能路由

基于多帧融合的视频文本检测

其他学术论文