复杂背景图像中的叠加文字提取技术研究

被引量 : 16次 | 上传用户:zyf008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像和视频中的文字包含有丰富的语义信息,是理解图像和视频内容的重要线索,提取和识别这种图像文字对于图像理解、视频内容分析、基于内容的图像和视频检索等领域具有重要意义。由于图像和视频中的文字通常叠加在复杂的图像背景之上,背景成分的干扰使得现有的OCR技术难以识别出文字,因而如何从图像的复杂背景中提取出文字成为一个有必要研究的问题。近年来,这一问题开始受到广泛关注,并取得了大量的研究成果,但由于区分文字与复杂背景的困难性,该问题还远没有得到完美解决。针对以上问题,本论文主要围绕如何充分利用文字的各种特性更鲁棒地从复杂背景图像中分割出叠加文字、去除残余背景进行了研究,并对使用文字的笔画特征来区分文字区域与复杂背景区域进行了尝试。本文研究取得的主要研究成果包括:1.提出了一种基于文字颜色和尺度信息的鲁棒的文字分割算法。利用文字的边缘特性设计采样规则,能够更准确地估计文字的颜色,并利用文字笔画的尺度特性,能够更有效地去除尺度不同于文字的复杂背景区域。2.提出了一组启发式约束条件,更严格地刻画了分割后的文字区域与残余背景区域在颜色、边缘、尺度以及空间关系上的区别,能够有效地去除范围相当广泛的残余背景,大大降低了残余背景对OCR识别的负面影响。3.对使用汉字的笔画特征从复杂背景图像中提取和确认候选文字区域进行了初步研究,验证了笔画线条的统计特征对于文字区域与复杂背景区域的区分能力。
其他文献
前言 类风湿性关节炎(RA)是一种以多关节炎病变为主的自身免疫性疾病。本病早期病变以关节滑膜炎为主;后期有软骨和骨的破坏。其特征性症状为对称性、多个关节慢性炎症性病变
名词的指称是目前语言学界研究的热点问题,我国的学者们早在20世纪50年代就已经注意了名词的有定和无定问题,但是少有对这一问题的专门论述,往往是在谈论其他问题的时候有所
目的:挖掘传统中医理论中的痰湿体质相关理论,总结近现代研究成果,系统阐述中医痰湿体质理论及其应用。明确痰湿体质的基本概念、形成因素、判定标准、发病趋势、调理方法,指
在构建和谐社会的大背景下,大众传播媒介对“三农”问题客观、真实、深入的报道有助于唤起全社会对“三农”问题的重视,增进社会各阶层对“三农”问题的认识。 本文主体共
随着高精度的计算机视觉系统的广泛应用,以及对计算机视觉系统获取三维景物信息精度要求的逐渐提高,摄像机标定已经成为计算机视觉的基础工作和首先必须努力解决的重要问题。
本文以作者在新西兰访问、交流中的所见所闻为素材,提出中国班主任是典型的适应型专家,是关怀儿童生活幸福的主要责任人,是学生发展项目的创生者。所以,我们需要保持对中国班
垃圾焚烧处理是以最快速度实现城市生活垃圾无害化、稳定化、资源化和减量化的最终处置目标的重要手段,在国外发达地区已经得到广泛使用,随着我国城市垃圾的产量和垃圾热值的
当今世界,经济现代化既具有国家或者地区性的特点,也表现为国家或地区的经济发展与全球经济之间的互动。因此,一方面需要对中东经济现代化的研究进一步深入,另一方面有必要从全球
食品安全是关系国计民生、人民健康和社会公信力的大事,但近年来,食品安全问题不仅没有得到有效遏制,还有不断扩大化的趋势.文章运用社会学结构化理论来分析食品安全政策失效
如何在地面重力环境中实验模拟空间微重力环境中的流动与传热传质具有很大意义而又尚未很好解决。本文目的就是研究微重力环境中空间站内通风换热过程的地面实验模拟问题,建立