基于视频文本检测和视频对象分割方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:daimao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文围绕与MPEG-7相关的关键技术之一——视频文本检测、定位和抽取方法进行了研究,由于视频文本的检测、定位、抽取和识别受背景的复杂度、对比度、分辨率、字体大小、排列方向、字形、运动方式等因素的影响,需考虑的因素较多,算法比较复杂。本文的主要工作即是针对国内外涉足较少的视频文本检测进行了较为深入的研究,为实现如何降低算法的复杂度、提高算法的鲁棒性和准确性这一目标,本文做了如下的工作: 1.提出了一种基于边缘信息和LH的方法检测视频帧文本所在的位置,边缘检测用Sobel算子,将检测到的边缘,经强度、密度检测后,计算其LH的值,经凸台检测后,得到文本区域的定位结果。实验表明这种方法计算简单,能快速地定位文本区域,且不受文本颜色、字形等的限制。对水平或垂直方向排列的视频文本,检测和分割效果良好。 2.提出一种基于小波和LH的检测算法,采用多分辨率的分析方法,不但考虑了水平和垂直方向的高频分量,也考虑了对角方向的高频分量,用具有良好时频局部特性和变尺度特性的小波分析方法提取出不同空间分辨率、不同方向的边缘子图象后经过强度和密度检测,用LH的方法进一步定位文本目标区域。实验表明这种方法由于采用多分辨率的分析方法,可对字体大小差别较大的视频文本进行检测,且不受文本颜色、字形等的限制。对水平或垂直方向排列的视频文本,检测和分割效果良好。 3.提出用形态学进行视频文本检测的两种方法。第一种方法结合了小波多分辨率的分析方法及形态学具有几何形状分析的特点,用小波分析方法提取文本的高频分量后,用形态学的方法进行进一步的处理,这样可不受文本排列方向的限制。第二种方法是提出一种基于形态学的方法提取边缘子图像,所提取的边缘具有良好的形状保持性。在提取到边缘子图像后,再通过区域标记、连通分量分析、形态后处理等一系列步骤对视频帧进行滤波,得到视频文本检测结果,最后再对其进行二值化处理,把文本字符从复杂背景中分离出来。实验表明这种方法可以
其他文献
世界上首条大容量超导电线可望于2000年在底特律投入使用。它长122米,重112.5公斤,但其输送的电流与重达8,200公斤的铜芯制成的电线相同。由于其电阻远小于通常由金属线制成
汽车已成为人们的主要交通运输工具之一,驾车族的队伍越来越庞大,为保证交通安全,有关专家提醒驾车族朋友注意,当遇到以下惊险情况时切莫慌张,要沉着冷静、小心谨慎地应对,把
文章针对钢结构粘钢加固技术的应用现状,进行全方位分析,并简要介绍了钢结构粘钢加固技术原理与技术优势,如灵活性较好、坚固耐用、保证工程如期完工等,并提出钢结构粘钢加固
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
咳嗽是一种保护性的所射动作,通过咳嗽,能将呼吸道内分泌物排出体外,防止分泌物排出体外,防止分泌物堆积形成深部痰痂.但频繁而无效的咳嗽给患者带来痛苦,增加体力消耗及不适
图像分割作为一门基本技术在医学、遥感及其它图像处理领域中有广泛应用。在各种分割技术中,活动围道分割方法在分割的准确性方面明显优胜于现有的各种非围道方法,因而在研究和
目的探讨综合护理干预在机械通气治疗新生儿肺炎患儿中的应用效果。方法选取2016年4月至2019年2月医院收治的新生儿肺炎患儿138例,依据随机数字表法分为对照组和观察组,每组6
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的分析脊柱术后切口感染的危险因素,为减少感染率提供预防措施与理论依据。方法计算机检索CNKI、万方、维普、中国生物医学文献、PubMed、Medline数据库,日期从建库至2018
研究生创新基地是研究生创新实践的重要部分,是研究生提高创新能力及科研能力的重要平台,为高校学科发展培养专门的高水平创新人才。本文通过创新基地的实践研究,提出了建设研究