基于Android平台的OCR识别技术研究与实现

来源 :电子科技大学 | 被引量 : 15次 | 上传用户:yyll2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能手机市场的迅猛发展和普及,Android成为所占市场份额最高的手机操作系统,与此同时,人们希望在手机终端享受更丰富舒适的应用功能。将OCR和Android智能终端相结合,依托光学字符识别技术可以解决信息的自动输入问题。由于字符识别涉及到图像处理等复杂计算过程,但Android平台本身的图像分析处理能力有限和字符识别的流程相对比较固定,因此对其做深入研究具有重要的意义。论文的研究重点是光学字符识别过程中的预处理过程和识别过程。针对图像预处理步骤,论文主要完成了两个方面的改进:一是设计适合Android平台的图像预处理流程,在传统的预处理流程基础上,增加一个文本图像判定过程,此过程主要通过分析待识别图像类型来完成。二是对现有的基于方向白游程长度的倾斜角度检测算法的检测区域和待计算的映射方向数目进行改进和优化,主要体现在以下两点:提取文本图像子区域作为算法检测对象和将原有的360个映射方向数目减少到180个。将改进后的倾斜检测算法和Android中的图形处理元素Matrix相结合,实现对大倾斜角度图片的检测及校正。并借助Android NDK技术和JNI接口等实现图像预处理算法。针对字符识别过程,研究了字符分割、特征提取以及分类器设计过程,并基于字符间的空白宽度改进了现有的字符分割算法。为了验证改进算法的有效性,论文以模板匹配分类器为基础设计并实现了一个基于Android平台的OCR识别系统,从功能上设计了图像采集、图像预处理、转换文字和系统设置四个模块。在整个系统实现过程中,在图像采集模块实现自定义相机和图库两种获取待识别图片的方式;图像预处理模块采用论文改进的算法完成预处理操作;转换文字模块负责提取图像上的文本信息;系统设置模块主要完成图片存放路径和预处理操作设置。测试结果表明,本文提出的文本图像判定和图像倾斜校正算法能提高字符识别效率并提升用户的体验性,达到了预期的设定目标,其大力推动了后续的基于光学字符识别应用的研究。
其他文献
传统的数据挖掘方法假设训练数据和测试数据服从相同的数据分布。然而,在许多情况下,这种同分布假设并不能得到满足。当分布发生变化时,传统的数据挖掘方法必须从头开始,需要
因环境变化导致皮肤病变异,其种类持续增多,发病率以及致死率也在不断升高,已经得到世界卫生组织的关注。目前,皮肤病诊断大都采用传统临床诊断方式,极大依赖于医生的临床经
高校内各职能部门为了提高各自的工作效率,满足各自职能的需求,建立起了基于不同平台、不同开发语言等千奇百态的信息系统,使得高校内信息系统与日俱增,然而各信息系统相互独
数字水印技术是一种有效的数字产品版权保护手段,其通过将有意义的数字信息隐藏在媒体中作为版权证明的依据。在过去几十年里,三维模型已被广泛地应用于虚拟现实、医学图像、
不经意传输协议(OT)是一种可保护隐私的密码协议,它既可以作为基本组件构造其它安全协议又可以单独应用于电子商务、医疗保健、内容保护等系统中以保护参与者的隐私。因此,提
随着互联网技术的迅速发展,各计算机终端都可以轻易拥有海量的信息资源,人们获取信息的渠道增多了,但同时也让很多用户觉得力不从心,当用户在网络上搜索信息时,往往就会因为
随着互联网技术飞速发展和普及以及嵌入式设备的小型化、智能化和网络化的发展,同时人们随时随地对于视频信息获取的迫切需要,将嵌入式智能设备接入互联网,并可以进行流媒体业务
学位
支持向量机是在统计学习理论上发展起来的一种新型机器学习方法,在解决模式识别领域中小样本,非线性,超高维等问题方面表现出明显的优势。为了解决现实中的数据在输入空间中
随着信息化时代的来临,人们逐渐进入一个数据量急剧膨胀的时代,面对海量的数据不知道该如何利用,人们普遍面临着“数据丰富而知识贫乏”的问题。数据挖掘技术的产生和发展为人们
学位
近几年来,我国的互联网络普及率仍维持稳步上升的态势,并带动了电子商务、网上支付等新兴行业的兴起。然而与此同时,各类网络安全事件也层出不穷,严重威胁老百姓的财产安全,