基于SSD的验证码识别研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:ss1725
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究验证码识别的过程,为了防止出现恶意破解密码、论坛灌水、刷票、刷页等现象,创造了验证码。随着网络使用量的增大,验证码的数据量也变得异常庞大,这就使得验证码标签的制作需求量增大。以往验证码的标签一直都是人工标注,可想而知,速度并不是很快,而且成本也不低,这时就迫切需要利用计算机识别验证码的方法。验证码识别的一般分为定位、分割、识别三个步骤,在这三个步骤中定位是否准确对识别验证码起着非常重要的作用。在验证码图片中,字符的定位一般采用K近邻分类器、BP网络、SVM等传统方法进行识别定位,这些方法都是基于统计方法构建的算法,这些算法在识别难度较低的验证码图片时表现良好,但是遇到字符粘连情况时就显得底气不足,所以需要一个能够更加准确地定位的方法。本文采用了SSD(Single Shot MultiBox Detector)深度学习网络,这种网络是ECCV2016(European Conference onComputer Vision(欧洲计算机视觉国际会议))的一篇文章提出的物体检测网络模型,它在保证了训练速度的情况下,又保证了测试精度。确定了定位方法后,接下来就是数据的预处理,本文使用的数据来源于客户提供总共546,423张验证码图片,通过对图片标签信息的解读能够对图片数据进行整理和筛选,接着利用随机采样的方法初选30000张,然后再对图片进行筛选,整理得到20000张图片做数据集,同时对这个数据集做编号,将数据集按9:1分为训练集和测试集,即有18000张训练集和2000张测试集,最后就可用此数据集来做定位和识别训练的数据集。在实现定位和识别算法的实现,也就是SSD网络的训练实施和识别算法的实施,需要预先准备好数据集以及caffe的编译,开始训练后在训练过程中会出现一些小问题,这些都需要仔细去查看,最重要的是在网络文件中路径的正确与否,以及参数的设置是否正确等等,并且为了训练收敛速度更快需要去采用合适的策略。本文的创新点如下,以往都是人工识别,速度慢,成本也高,而本文使用计算机识别速度快,效率高,相应的成本也就低。人工打码的准确率不到85%,客户提出要求为85%,希望识别准确率能相比人工高些,利用本文中的方法准确率达到85.796%。定位、分割方法上以往都是用的诸如SVM的传统算法,本文用的是深度学习SSD网络,相比传统方法调参更加方便,准确率也更高。深度学习已经显著运用到各行各业中,未来世界将网络智能化方面发展,深度学习就是一个很好的实现人工智能的途径,所以在深度学习研究上需要更进一步的发展。
其他文献
<正>1831年秋,肖邦来到巴黎,并较快地结识了一批艺术界的朋友,其中就有费迪南·希勒、费利克斯·门德尔松、罗伯特·舒曼这样的德国大音乐家和海涅这样的大诗人。他们尊崇肖
<正>事件概要一幅近乎全白的油画估值1.2亿元?别惊讶,这不是天方夜谭。下个月举槌的纽约苏富比拍卖会上,就将出现一幅远看像块白布的"空白画"。这件作品是由美国极简主义艺术
探索农村金融创新,通过产品创新、服务组织创新和制度创新服务县域特色产业的发展是当前县域金融发展的重要课题。国家级农村综合改革试验区——贵州湄潭县的茶产业的发展案
<正>第三节马塞尔·齐亚皮1891年5月29日,马塞尔·齐亚皮(Marcel Ciampi)生于巴黎,其早年与玛丽·佩雷斯·德·布兰比拉(Marie Perez de Brambilla)学习—布兰比拉曾师从于安
实现旅游业可持续发展有赖于完善科学的资金扶持。本文对照国际通行的旅游业可持续发展标准、原则对阳朔旅游业现状进行了初步分析,就资金扶持当中存在的主要问题进行了归纳,
使用汽油胶质含量测量方法《燃料胶质含量的测定喷射蒸发法》,扩展测量重芳烃中胶质含量,考察了加热温度以及加热时间对胶质含量测量值的影响,通过多次测量,确定了测量重芳烃
<正>美国杂志《Complex》,曾发表过一项名为"在世身家最高的当代艺术家Top15"的调查:雕塑家安东尼·葛姆雷以5000万美金的成绩位列第八。与其他上榜的艺术家相比,他的作品并
期刊
<正>隋唐官印近年来逐渐引起关注,若干新的出土品或传世藏品也陆续见有发表。数据的拓展无疑为着手对这一阶段官印体制开展系统研究创造了此前所不具备的条件。搜寻隋唐官印
期刊
<正>肖邦到巴黎不久,法国当时的著名评论家费蒂听了他的音乐会后就得出结论说:"原创成了他出类拔萃的特点。"自此之后,诸多评论家都异口同声地说,肖邦是位原创性作曲家。于是
单光子发射型断层显像仪[single-photon emission(computed)tomograph,SPET,SPECT]和正电子放射型断层显像仪(positron emission tomo-graph,PET)是当前核医学临床检查的高级