基于骨架点分割算法的文本验证码攻击模型的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:tiefer34
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
验证码,又被称为区分人类和计算机的图灵测试,是世界上使用最为广泛的公共全自动安全程序。验证码的设计目的,在于确保每一个在网络中访问的用户都是人类而非计算机程序。这样既保证了服务器能够服务于人类,也避免了由程序恶意攻击而导致的服务器瘫痪、网络秩序的混乱和财产的损失。目前,验证码主要包括文本验证码、语音验证码、行为验证码等类型。在众多的验证码形式中,文本验证码由于它的易于设计和维护、代码体积小等优点,成为了使用最为广泛的一种验证码形式。所以,针对文本验证码的自动识别技术备受关注。目前文本验证码采用的防御技术大致分为复杂的背景、噪声、干扰线、扭曲旋转、字符粘连五类。字符粘连是目前的验证码防御技术中相对可靠的一种,此类验证码内的字符通常有10%到50%不等的重叠,且字符的长度也不固定,无法通过预测字符的潜在区域来分割验证码。当验证码分割算法无法准确分割字符时,分类器的识别性能会降低。所以字符粘连型验证码被广泛使用。不定长度的字符粘连型验证码仍然是验证码识别领域的研究热点。本文针对字符粘连型文本验证码,设计了一种新的基于骨架分割算法的验证码攻击模型,该模型能够有效地破解字符粘连型文本验证码。主要工作内容分为以下几点:(1)根据传统验证码分割算法的不足以及粘连字符验证码的特点,提出了一种新的文本验证码分割算法。该算法不同于传统方法的“切片式分割”,而是通过打破字符内部结构的方法,将字符破坏重组,从而将字符从验证码中分离出来。该算法能够快速有效地分离和识别字符,相较于传统的分割算法(CFS算法,三色柱投影法等),正确率有了较大的提升。(2)重组后的字符序列的临近字符具有相关性,而传统Softmax输出层只能对依据内容对图片进行分类,无法利用字符序列的相关性信息。针对这一缺陷,提出Scored输出层,通过Scored函数对每一个可能存在的字符赋予置信分数,最后在输出序列中选取前K个(K为验证码包含的字符数)最大置信度为输出,增强了网络的表达能力。(3)设计了大量实验来评估所提模型的性能。实验的数据集包含Microsoft,Apple,Wikipedia等世界上流量较大的十余个网站的超过10000张文本验证码图片。实验结果表明,本文模型能够取得良好的效果。此外,与传统的验证码分割算法以及最先进的验证码攻击模型分别进行了对比。结果表明,基于骨架点分割算法的验证码攻击模型在识别字符粘连型验证码方面具有一定优势。
其他文献
管办评分离是我国教育改革发展过程中一项重要的举措,是教育领域近年来重要的综合改革内容之一,也是是全面推进依法治教,学校自主办学的必然要求。特别是对于基础教育学校而
杂环是众多天然产物与药物分子最重要的基本骨架之一,具有抗菌、抗病毒、消炎、抗肿瘤等广谱生物活性。光学活性单杂环或多(稠)杂环体系由于广泛存在于天然产物和手性药物结构中,引起了化学家们的极大关注,如何实现高效的立体控制构筑杂环化合物已成为当今有机合成化学研究中的最为重要和关键的科学问题之一,极具挑战性,为新合成方法和新反应的发现创造了契机。本论文以高效构筑新型杂环骨架为核心,以有机催化串联反应为策略
自我肯定对于减少个体由威胁所引起的防御反应,从而以更完善更全面的视角去看待威胁,从有威胁但有价值的信息中收获与成长具有重要的意义。以往研究中常使用查看自我价值列表
细菌挥发物在“细菌-线虫”互作中发挥重要作用,同时吸引线虫的细菌挥发物在线虫生防中有着潜在的应用价值。本文开展三方面的研究内容:首先,以秀丽隐杆线虫(Caenorhabditis elegans)和全齿复活线虫(Panagrellus redivivus)为靶标,从各种生境来源的细菌中筛选出一批诱吸线虫的细菌资源;其次,通过解析16S rRNA基因序列,从而确定吸引线虫细菌的分类地位;最后,经由G
随着数字信号处理器(DSP)应用的不断扩展,如何提高DSP的运算性能面临着新的挑战。SIMD架构能充分发掘应用的数据级并行,以较低的硬件开销和功耗预算实现较高的峰值运算性能,
网络传输速率的飞速提升对网络设备的处理性能提出了更高的要求。网络处理设备上的慢速I/O、存储器和高速处理单元之间的性能差距极大地影响着报文处理性能。研究表明,网络报
社会的高速发展、信息的爆炸式输出,使得整个社会都处于一个浮躁的状态,生活在都市的人们既享受着都市的繁华但同时也会产生很多忧伤与烦恼。这使得媒体、创作者们越来越关注人们的生存状态以及价值观的思考,特别是女性群体的话语权。因而在近些年出现的新都市电影中,可以明显看到女性形象不断推陈出新,这现象背后蕴含着深刻社会意义,因此本文以新都市电影中的女性形象为研究对象,以笔者的毕业作品《你好,嘟嘟》为研究案例,
学位
Sturmian序列在众多领域中起着重要作用,由Sturmian序列我们可以定义有限平衡词以及极不平衡词。本文考查这些有限词及其二进制轨道的相关性质。向量间的优化关系可以用来定义二进制轨道间的偏序关系,已知在这种序下,具有相同长度和斜率的有限词中,平衡词的轨道达到极小,而极不平衡词的轨道达到极大,我们进一步研究了平衡词与极不平衡词的r(r≥1)阶矩和中心矩的极值性质;当0<r<1时,我
随着图像和视频相关技术飞速发展,大量的人体运动图像和视频数据提供足够的材料用来研究人体运动的相关方面,其中人体运动参数估计是最重要最热门的一个研究方向。对比一般的
农作物资源作为人类生活必不可少地一部分,在国民生产中同样占据重要地位。而影响农作物生长的关键因素之一就是病虫害,病虫害若得不到及时检测和诊断,则会极大减少农作物的