图像文本定位与分割方法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:zhang_jun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着大数据时代带来的海量信息检索的迫切需求,图像中文本提取具有越来越重要的应用价值。图像中的文本信息是理解整个图像的重要内容,大量图像文本提取算法已经用于特定场合,如视频安全监控、实时车牌识别、汽车自动驾驶和基于内容的图像索引等。然而,由于图像往往具有复杂的背景和低对比度,加上图像中的文本在字体、尺寸、样式、颜色、方向、对齐等方面存在大量变化源,这些因素使得文本提取变得极具挑战。图像中文本提取可分为文本定位、文本分割和文本识别三个步骤。文本识别现已有成熟应用软件,因此本文重点针对前两个步骤,研究了复杂背景下图像中的文本定位和分割方法,主要研究内容如下:1.针对笔画宽度变换(Stroke Width Transform,SWT)文本定位算法易受复杂背景干扰问题,提出了一种基于改进的笔画宽度变换场景图像文本定位方法。算法首先对场景文本进行预处理,矫正场景文本的对比度低和非均匀光照的影响。然后采用最大稳定极值区域(MSER)算法对图像进行文本检测,得到一系列文本候选区域。随后在文本候选区域内进行笔画宽度变换,通过启发性规则滤除非文本候选区域。最后引入视觉显著性特征,将视觉显著性与笔画宽度特征融合,进一步判决候选字符区域。实验结果表明,该算法相比于经典的SWT算法定位效果有了很大的提升,适用于复杂场景文本定位,鲁棒性较好。2.针对Niblack算法过于夸大图像细节、出现伪影和断笔现象问题,提出一种改进的Niblack算法。算法首先在图像局部特性基础上考虑了图像的整体特性,结合Otsu全局阈值法和Niblack局部阈值法的优势进行了改进;接着引入局部窗口中极大值、极小值之差作为阈值进行进一步处理生成两幅图像;最后对这两幅图像进行逻辑与操作得到最终二值化结果,有效的消除了伪影和断笔现象。实验证明该算法的分割效果明显优于Niblack算法和Otsu算法,有良好的适应性,是一种有效的文本图像分割算法,有较好的实用价值。
其他文献
随着我国利率市场化进程的逐步加快,金融机构在参与金融活动的过程中面临越来越大的利率风险,诞生于1982年的利率互换作为对冲利率风险的衍生金融工具,逐渐被广大市场参与者
<正>大黄属中药泻下药,始载于《神农本草经》。大黄来源于蓼科植物掌叶,其性味苦、寒,功效泻热通肠、凉血解毒、逐瘀通经[1]。大黄主要含蒽醌类衍生物和二蒽酮衍生物,此外尚
咪唑型离子液体因为其良好的化学稳定性和热稳定性,已经作为一种有前景的萃取剂被应用在分离领域。离子液体支撑液膜技术结合了离子液体优异的溶剂性能和膜分离效率高的优点,
为了探讨气温升高对宁夏旱区马铃薯块茎中淀粉形成和产量形成的影响,以宁夏南部山区主栽品种青薯9号作为供试材料,研究了块茎形成期高温对马铃薯块茎淀粉含量和淀粉形成关键
喷雾干燥技术已有一百多年的发展史,但由于制盐工业原理简单,盐业改革前多品种盐品种少、制作简单等原因,喷雾干燥技术一直没有被引入。现列举利用喷雾干燥技术制备微胶囊和
水仓清理设备机器人化已是当前矿山清仓机械设备研制和发展的主要方向。结合多年清仓机械研究和制造经验,以及现场反馈的实际问题,在现有清仓机基础上进行研制和创新,设计和
<正>师生和谐是建设现代学校制度的重要目标,也是现代学校制度的美好境界。教师和学生是学校的两大主体,有师生和谐才有学校的和谐。师生关系和谐是学生健康快乐成长的动力和
无线网络由多个网络连接在一起构成,其特殊之处在于抛弃了传统网线,由无线通讯技术实现连接。无线网络的出现使得网络的组建方式摆脱了物理依赖,具有较强的灵活性和扩展性。得益于便捷的组建方式使得无线网络成长迅速,其主要包含短距离蓝牙网络、无线局域网以及无线传感器网络(Wireless Sensor Networks,WSNs)。WSNs是由具有无线射频通信能力且可执行多跳路由协议的微型传感器构成。微电机系
冠心病的发病率和死亡率居高不下,其快速进展严重威胁人类健康与生命,而动脉粥样硬化(atherosclerosis,AS)是冠心病的病理基础,早期AS没有明显临床症状,而晚期AS斑块容易出现
<正>数学概念是数学教学的逻辑起点,是学生认知的基础,是学生进行数学思维的核心,因而理解概念是一切数学活动的基础,概念不清就无法进一步开展其它数学活动,可见概念教学在