论文部分内容阅读
Android是现在最流行的移动设备智能操作系统之一,是Google发布的基于Linux平台的开源移动手机平台。伴随着3G时代的到来,移动应用终端发展也成为现代人关注的焦点之一,智能手机操作系统的应运而生使得相关的应用也变得越来越重要,当前的Android智能手机、Pad等都安装有精良、高配置的摄像头,能够随时随地的在人们的生活环境中捕获到文字信息。Android用户对于字符识别相关的需求也越来越高,基于Android平台的字符识别应用软件的研究和开发显得很有必要。本文针对Android平台视频监控中简单背景下印刷体数字和大小写英文字母的实时识别的应用需求,运用Android开发的相关技术以及图像处理的多种方法,对视频预处理、字符定位、倾斜调整、字符分割以及字符识别等过程进行了研究,并设计和实现了Android平台视频实时字符识别系统。本文的主要研究工作及取得的成果包括:(1) Android实时视频预处理研究。主要研究了将YUV420视频格式转换为RGB格式,以及图像灰度化、中值滤波、二值化和边缘检测等视频预处理过程及相关算法,并采用基于NDK的开发框架来提高处理效率。实验表明,采用本文方法在保证字符区域提取效果的前提下,时耗仅为通常方法的20.58%。(2)基于感兴趣区域(ROI)运动检测的实时定位方法研究。考虑到视频图像的连续性和相似性特点,采用区域运动检测跟踪设备位置,根据感兴趣区域信息略去重复定位相同字符的过程,提高定位的效率。实验表明,采用该算法字符定位准确率达到95.67%,并且平均处理速率上相比于普通方法提高了40%。(3)基于图像二维投影的字符分割方法研究。为提高字符分割的准确性,采用了二维投影方法进行字符分割。通过对字符垂直和水平投影的分析,找出字符分割的关键坐标点,从而快速准确地将单行字符分割成多个供模板匹配的单个字符。(4)基于多模板匹配和误差阈值筛选法相结合的字符识别方法。通过对多模板匹配和误差阈值法的研究和分析,将二者相结合,既保证识别率又保证识别速率。该方法达到了94%的识别准确率,在平均处理速率上相比于普通方法提高了58.4%,达到了实时识别要求。