基于角点检测和卷积神经网络的字符识别

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:qq104397622
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及以及电子商务技术的快速发展,网上购物在人们的日常生活中变得司空见惯。与实体店购物不同,网购环境下用户无法接触商品实物,用户一般是根据电商网站提供的商品信息来决定是否购买。而商品信息中,除了一部分以文本、表格的形式给出外,越来越多的是以图片的形式呈现。在这种情况下,比较容易出现两种问题:一是商品信息图片中的内容和商品规格参数中的内容不一致,这将给用户带来理解困扰;二是某些商品信息采用图片的方式来规避对敏感或违禁词的检测,做虚假宣传、虚假广告。因此,需要运用图片字符识别技术设计一个系统自动提取商品信息图片中的文本信息,这样才能有助于电商企业更好地进行信息监管、商品推荐以及售后服务。针对此应用背景,本论文对图像字符检测识别领域进行研究分析,通过结合改进的现有技术进行商品信息图片的字符检测与识别,以期达到自动识别电商图片字符信息的目标。  本文首先调研了图像字符识别的研究背景及应用前景,研究了国内外该领域的研究现状,发现字符检测的研究对象大部分是英文字符,对其它字符,譬如汉字的检测研究很少;而且对汉字的识别方法需要更多的改进和探索。  接着,对字符检测算法进行研究,包括图像处理技术和角点检测算法。图像处理技术主要作用有两个:一是对图像数据进行去噪、增强处理(图像平滑、图像锐化),为后续运算提供高质量的输入数据(因为图片是人工采集的,可能存在不合要求图片,需要清理;而图片流转过程会带人噪声,因此需要进行去噪等预处理);二是字符检测需要运用图像处理技术(形态学处理)对字符的边缘强化。经过上述处理后,采用Harris角点检测法对图片的字符区域标记,得到字符候选区。  然后,介绍了字符定位方法,因为字符检测确定的字符候选区域包含部分背景区域,会对字符识别造成干扰,因此需要精确定位字符位置。字符区域比背景区域有更多的边缘特征,因此本文选择HOG特征提取法获取字符的特征向量,然后使用支持向量机进行分类,去除大部分背景区域,最后确定字符的精确位置。  最后,研究了字符识别算法。字符识别之前,首先进行字符分割,针对标记的区域利用平行投影方法确定文本行,再使用垂直投影在列方向进行处理,从而确定单个字符区域,最后完成字符分割。在字符识别步骤中,将输入图片归一化为32×32的大小,像素写成向量形式传给CNN的输入层,CNN经过卷积层、激活层、全连接层的处理,最后输出一维矢量,对应概率最大的字符作为识别结果。根据常用的评价指标:精确率、召回率和F-Score,分析字符检测和字符识别的性能及其影响因素。实验结果验证了论文所使用方法的有效性,该方法能基本完成电商图片字符识别的功能,具有一定的研究意义和应用性。
其他文献
在工业生产中,气液两相流钝体绕流是一种非常普遍的现象,研究气液两相流钝体绕流现象的机理对安全、高效生产有着重要的意义。本文通过分析实验所采集的气液两相流钝体绕流漩涡
当前平安城市项目不断推进,智能交通也日新月异的发展,在智能交通为人们带来更加便捷、安全、顺畅生活的同时,每天也是不间断的产生着丰富的音、视频数据,从而导致智能交通数据不
学位
关于Linux2.6移植、驱动开发、实际应用的论文可以说很多,但纵观这些论文大多数选择的是ARM处理器;此外SOC厂商基本已经移植好Linux内核。本论文采用的是国产CPU——CSKY,让更
本课题设计的智能电子式电能表,除实现基本的计量电能和费用核算外,还可以实现与智能电网数据信息的双向传输,用户用电的同时可向供电部门反馈客户实际用电情况以及整体用电分布
学位
伴随着社会和经济的进步,工业自动化水平不断提高,工业控制领域对运动控制的高速,控制精度等性能提出了越来越高的要求,国内和世界市场对高端产品的锻压设备需求不断地上升。  
学位
学位
本篇文献中出现的经典相关系数有三种,它们分别由统计学的奠基人Pearson提出的积矩相关系数(Pearson‘s Product Moment Correlation Coefficient,PPMCC),心理学家Spearman提出