论文部分内容阅读
随着计算机技术的飞速发展,人类社会由工业化社会逐渐转变为信息化社会,信息化程度越来越高。伴随着互联网技术的发展,人们之间的信息传递不再靠纸质材料,所有文件都要转换为电子文档,这就为需要人们手工录入这些文字信息,为日常工作增添了大量的重复工作。为了提高人们日常工作的效率,让信息交流的更加流畅,文字识别技术日益受到众多学者的关注。同时,让计算机代替人类来完成这些重复性的工作就对计算机等辅助设备的智能程度提出了更高的要求。目前,计算机文字识别技术已经非常成熟,对于印刷体汉字,扫描文件的汉字,识别速度快,准确率高,极大的提高了我们的工作效率。移动道路测量系统是现代测绘行业的前沿技术,该系统解决了海量空间数据的存储和快速更新问题,更进一步要从这些海量数据中提取更多有用的信息。街景影像作为移动道路测量系统采集的基础数据之一,其包含了大量的文字信息,如果能自动的提取这些文字信息,对于信息的检索,兴趣点的搜索定位是非常有价值的。本文将空间信息技术和文字识别技术相结合,解决街景影像中文字识别问题。街景影像中文字信息背景复杂,在影像中的位置不确定,文字多为广告牌匾上的文字,艺术效果较多。要想识别文字,首先要确定文字的区域范围,本文提出了基于数学形态学分析和连通区域分析的文字区域定位方法,将文字从复杂背景中提取出来,为进一步的文字识别奠定良好的基础。文字识别属于模式识别的一种,模式识别理论是在计算机技术突飞猛进的基础上,研究人员深入研究人类的行为和思维模式所提出的一种识别方法。模式识别方法较多,人工神经网络模式识别打破的传统模式识别的方法,为模式识别开辟了一个新的研究方向。由于神经网络基于分式高速并行处理的工作原则,其具有很强的自学习能力,联想记忆能力,容错性,可扩展性,组织性等特性。因此,采用神经网络的文字识别方法,可以提高识别的质量并且识别比预定义字符更多的字符。本文采用的是单隐含层的BP神经网络文字识别对字符进行识别。实验结果表明,本文所提出的文字区域定位方法和神经网络文字识别方法可以较准确的将文字区域定位出来,对区域中文字基本都能识别出来。