视频理解和检索中文字的检测与提取技术研究

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:shuxiaopei110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文研究的主要内容是视频中文字信息的检测、提取与识别技术,它是基于内容的视频理解和检索的重要组成部分。作为一个有着广泛应用背景的研究领域,视频文字的检测与提取(Text Detection and Extraction,简称TDE)吸引了大批研究学者的参与。本文在前人工作的基础上,通过对视频分段以及视频数据多级结构的分析,重点研究了非压缩域和压缩域视频中文字的检测与提取方法,设计并实现了一个完整的基于边缘检测—投影的视频TDE系统,并期望在此基础上增强对算法的理解以及对某些问题的求解作出改进。 视频数据包含丰富的语义内容,但同时具有复杂的时空维信息,本文首先对视频数据的分段及多级结构抽象作了分析,进而针对基于内容的视频检索中的若干关键技术(镜头变换检测、关键帧提取和场景分割)进行重点研究和分析。这部分内容是视频文字检测与提取(TDE)算法研究的基础。 在非压缩域视频中文字的检测与提取(TDE)方面,本文着重研究了文字事件检测、候选文字区域的检测与分割、非文字区域滤除、单字分割以及视频文字识别(Video OCR)等内容。针对每种方法,本文都给出了算法分析和实现步骤,并指出其适用范围。在这一部分,本文还研究和实现了一种基于小波变换和形态学操作的TDE算法,并给出实验结果与分析。 在压缩域视频中文字的检测与提取方面,本文主要研究了基于DC图像序列和DCT块的TDE算法。作为基础内容,首先介绍了DCT变换的基本思想以及MPEG视频压缩编码标准。然后详细研究了DC图像的获取方法并给出实验结果,同时对一种基于DCT块的TDE算法做了改进和实验验证。最后,本文还分析了一种基于视频各分量信息抽取、压缩域和空间域结合的文字检测与提取(TDE)方法。 通过对各种边缘检测算法的实验分析,本文设计和实现了一种基于边缘检测一投影的视频TDE实验系统。针对每个关键算法都作了详尽分析和实验结果评价,并指出该算法的优缺点。结果表明,该实验系统取得了较好的文字提取效果。最后,本文还指出了TDE算法研究的发展方向及在视频理解与检索中的应用前景。
其他文献
针对电子商务应用的一个重要分支—网络交易系统的特点和应用中存在的问题,本文对网络交易系统中的一些理论和关键技术问题进行了研究和阐述,并提出了“网络交易系统安全体系
实时应用是很常见的一类应用。与其他应用相比,实时应用最显著的特征是具有截止期限,任务应该在截止期限之前完成。根据实时性需求不同,实时应用可以分为硬实时应用和软实时应用
  本文介绍了有关QoS路由的一些基本原理以及目前国内外对QoS路由问题的研究状况,然后探讨了蚁群算法在多约束的QoS动态组播路由选择中的应用问题,提出了一种基于蚁群算法的Q
现代社会对于人类自身身份识别的准确性、安全性与实用性提出了更高要求,传统身份识别方法正越来越受到局限。随着生物识别悄然兴起,它逐渐成为了一种新的身份识别技术。而步
随着信息化发展,电子投票大规模应用已成为趋势。本文从电子投票匿名性出发使用基于RLWE的同态加密算法设计了一套私密的多候选人电子投票协议,在计票阶段采用密文计票形式,
图像显著性检测具有很长的研究历史,但因其是模仿人类的视觉注意机制,所以一直以来是一个具有挑战性的研究领域。图像显著性检测就是将图像中的重要内容检测出来,为后续的图
随着计算机技术的发展,价格低廉、体积小巧的各种嵌入式设备得到广泛应用,这些应用对网络连接的需求也日益增长。大量嵌入式设备接入网络使得IPv4地址不足的问题愈加突出。IP
BOSS系统是电信运营商的业务运营支撑系统,在企业的生产机制中占有十分重要的地位。由于各地应用模式的差别也不利于业务的开展,各相关业务系统的建设要求我们对系统进行严格定位,防止重复建设、投资浪费的现象。因此,为适应日益激烈的市场竞争和新业务的发展,我们必须着眼全局,对系统进行整体规划,使之成为一体化的电信支撑系统,这是电信发展和提高服务的必然要求。 为赢得用户,随着企业内部组织机构的变革、新
本课题首先仔细分析和研究了MIS系统开发的成熟技术,在此基础上综合运用这些技术,提出了干部组织管理信息系统的开发方案,详细设计开发了该人事组织信息管理子系统。 人事
近年来,随着移动智能终端和物联网技术的兴起,集成电路领域得到了飞速发展。其中,现场可编程逻辑门阵列(FPGA)和专用集成电路(ASIC)获得了众多企业的认可。为了降低IC设计成