复杂背景图像中的文本定位方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:Cgsking
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术的飞速发展,复杂背景图像中的文本定位研究不仅丰富了图像处理理论,而且在诸如Internet环境下的图像检索、交通管理中的车牌识别等具有重大的价值。复杂背景文本定位是一个具有很大难度性的研究课题。原因是文本图像的背景非常复杂,图像有的在室内拍摄而有的在室外拍摄,光照条件变化较大,其中不同文字的颜色、亮度、字体、大小、间距、对比度、排列方向和背景纹理等有很大差别。要提取具有复杂背景的文本,首先要找到包含文本的区域,然后才能交给文本识别模块进行识别。本文考察了现有的主要文本定位方法,分析了其中的优缺点,提出了基于边缘检测和支持向量机的图像文本定位方法。基于边缘检测的文本定位主要由金字塔分解、基于改进Canny算子的边缘检测、边缘提取和二值化、连通区域分析、以及文本区域鉴定与合并几部分组成。首先运用改进的Canny边缘检测算法检测出文本边缘,然后对检测结果进行连通区域分析、文本区域鉴定与合并得到候选的文本区域。由于统计模型在模式识别研究中体现出的优势,本文通过将定位出的候选文本区域运用支持向量机的分类器训练的方法来提高文本定位的准确性,由于采用了主动学习的支持向量机,有效的减少了训练样本的数量,同时也取得了较好的实验结果。实验结果表明,本文所提出的文本定位方法不但可以较准确的定位出相应的文本区域,而且具有一定的理论意义和较大的实用价值。
其他文献
随着计算机技术和互联网的快速发展,社交网络、智能设备、传感器设备、云计算中心实时生成大量的信息数据,如何从中提取有价值的知识已成为一个巨大的挑战。形式概念分析由德
大数据正在成为继云计算、物联网、移动互联网之后新的信息革命高潮。无论是从数据传递及共享、数据存储,还是从数据检索及分析,信息技术正面临前所未有的挑战。信息表示和查询
软件测试是为了保证软件的正确运行而进行的一项重要活动,回归测试是软件修改后为了确认修改的正确性而进行的软件测试。回归测试策略分为重测所有(retest-all)和选择性(selec
随着WWW的迅速发展和普及,人们已经从信息资源匮乏的时代迅速过渡到信息极为丰富的数字化时代。面对网上海量的信息资源,人们很难迅速有效的找到真正所需的信息。因此,如何合
数字图像每天都以惊人的速度产生和发布。图像中含有的信息往往比文本更加丰富,在人们的日常生活中起着至关重要的作用。因此,如何更加有效的组织、管理大型图像数据库,并且能从
处于大数据时代下,网络信息出现迅猛增长的趋势,互联网日趋发展成为一个信息覆盖面广的共享仓库,与此同时,对信息资源进行准确地理解也变得越来越困难,这是信息时代中一个亟
物联网感知层是物联网末端的一项全新的有着特殊意义的技术,也是它的核心部分。常见的物联网感知层常见形式有传统条码、二维码标签和无线射频识别技术,其中无线射频识别技术
XML已经成为Internet上数据表示和数据交换的标准格式。近年来,在Web上涌现了大量的XML数据。为了更容易的操作XML文档中的数据,专家和学者们在编码、索引、查询等方面做了积
随着Internet的普及应用,人们对网络安全的需求日益增加,访问控制是防止非授权访问的一种重要的网络安全手段。基于角色的访问控制(RBAC:Role Based Access Control)模型有效
自愈调控是构建可信计算机系统的必要手段,也是系统高可用性的重要保证。传统的分布式系统失效恢复技术主要依赖高成本冗余和人为管理,由于系统失效后人为修复的难度和成本加