基于交互平台的复杂背景图像文字检测及其应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:JK0803Tangxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂背景的文本检测是近几年新兴的研究方向。作为目标检测的一种,文本检测更加复杂,同时也更具挑战。聚类算法常被应用在文本的聚链阶段,传统的聚类算法需要设置两个参数,参数的设置对最终结果影响非常大,并且不具备较强的推广性。当应用场景发生改变时,检测效果将大幅下降。针对该问题本文提出了一种基于参数自适应的层次聚类算法,并通过对汉字这类结构复杂的文本分析,在传统检测算法的基础上提出一种由弱到强的文本检测框架。首先,针对层次聚类算法参数设置的问题,提出参数自适应的层次聚类算法。用高鲁棒性的文本/背景分类器取代分裂阈值参数以增强其泛化能力。分类器的建立是对单个字符和背景区域进行三种高水平特征提取,并进行有监督学习。对于第二个参数提出聚类特征的整合方法,从而避免了不同参数权重的设置问题。通过在不同的数据集上的对比实验,可以验证本文提出的算法对这一问题取得很好的改善效果。其次,本文针对汉字结构复杂的问题,提出由弱到强的文本检测框架。中文通常有多个子部分组成,每个子部分都可能是一个单独的汉字,并且某些子部分十分接近于背景区域。针对这一特点本文提出了从部分到整体、由弱规则到强规则的中文检测框架。先将汉字的子部分与背景进行区分,再进行文本的整合从完整字符的角度进行分析。本文分别在复杂背景英文及中文图片上对算法进行实验验证,通过对比实验可以看出本文提出的文本检测框架对中文的检测效果远远好于传统算法,并同样适用于英文检测。最后,本文针对实际应用平台采集的图片拍摄质量差,从而影响文本检测的召回率的问题,在系统应用层面提出一套完整的图像预处理方案。采用图像预处理算法对噪声进行图像增强及降噪处理,以解决图像低对比度的问题。并且将文本检测算法移植到机器人平台上,并对文本检测进行功能扩展。该系统实现了文本识别、文本翻译及文本网页搜索功能,为机器人提供了一种新颖的人机交互方式。通过对机器人平台采集的图像进行检测实验,可以验证本文提出的预处理方案可以对低对比度问题得到很大程度的改善。
其他文献
手势识别的研究具有广阔的实际应用前景,基于计算机视觉的手势识别能够提供更加自然、和谐的人机交互方式,是手势识别技术发展的趋势。但是由于手势具有时间和空间上的多样性
流程工业生产调度问题是流程企业关注的最主要的问题之一,它在企业的生产过程中有着不可忽视的作用。混合流水车间调度问题在流程工业生产调度中有着广泛的研究,因此本文以混合流水车间调度问题为主要研究内容。在混合流水车间生产调度模型中,传统的模型求解方法很容易陷入局部最优解和早熟收敛,因此会影响到企业制定合理的生产调度方案。如果整个生产车间中出现机器设备等故障时,会直接导致当前调度方案失效。鉴于以上问题,本
张力控制的好坏直接关系到产品的质量,智能控制技术在解决现代复杂被控对象的控制上比传统控制技术有明显的优越性。在进行卷取张力控制时,传统PID控制器的参数往往是针对固
能源是国民经济发展的重要基础,随着我国经济快速增长,能源与环境问题已成为制约我国进一步快速、和谐发展的根本性问题。钢铁工业是高耗能行业,煤气是钢铁企业中最重要的二
学位
为了提高无人机着陆自主性和智能性,本文研究了基于视觉的固定翼无人机自主着陆方法。以某型无人机自主着陆过程中所拍摄跑道场景图像为研究材料,综合运用图像处理技术、摄影
在现代科学研究中,制造智能机器人,已经成为了人工智能领域的最高目标。现在计算机的逻辑运算能力已经远远超过人类,但是与人类的智能却还有很大的距离。“问题不在于智能机
汽车柔性涂装生产线是汽车生产的四大工艺之一,而柔性涂装输送线是柔性涂装生产线的动脉,其运行的好坏对汽车车身表面涂装质量的优劣起着至关重要的影响。准确、实时的故障报
随着科学技术的发展,通信设备、消费电子产品以及仪器仪表等设备对开关电源需求迅猛增长,电源是仪器仪表的重要组成部分,绿色环保型开关电源是仪器仪表和消费电子产品电源的发展方向。目前各种电器都在大量使用开关电源,故进一步研究开关电源的工作原理,提高其可靠性,研发绿色环保型开关电源具有重要的现实意义。而所谓绿色环保型开关电源首先要求节能,其次是电源不能(或较少地)对电网以及周围设备产生污染和干扰。本论文主
学位
微波成像扫描仪是气象卫星上的一个重要设备。扫描控制系统是扫描仪的电气控制执行机构,其控制性能直接关系到扫描仪的成像精度和卫星的任务完成情况。因此,研究高精度扫描控制系统设计方法和技术具有重要的实际意义。控制系统的设计不仅包括硬件设计还包括软件设计,软件设计就必然涉及到控制算法的研究和应用。许多控制算法都是基于模型的算法,模型的辨识及其准确程度的高低决定了算法的可行性和所能达到的性能。本文正是基于此