对基于VQA任务的验证码安全性研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:jeffyi2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
验证码(Completely Automated Public Turing Test to Tell Computers and Humans Apart)是一种保护计算机免受恶意程序侵扰的有效机制。其工作原理,是利用对于机器而言难以解决的AI问题,来区别合法的人类用户以及非法的恶意程序。以目前最广泛使用的文本验证码以及图形验证码为例,其背后的AI问题分别是字符识别以及目标识别问题。随着大数据时代的到来以及硬件设备的迅速发展,以此为依托的深度学习在各个领域,取得了卓越的成就。普通的字符识别或者目标识别问题,对于深度学习技术而言已经不再是挑战。这也宣示了主流的文本或图形验证码,将无法再保障计算机的安全。因此目前迫切需要一种新型机制来弥补当前验证码的不足。除了利用视觉识别任务作为验证码中的AI问题,研究者也尝试了运用其他一系列任务,例如语音识别、视频内容理解等问题进行验证码设计。然而这些机制往往因为高昂的部署代价,并没有被广泛使用。随着深度学习的研究逐渐深入,研究者们转向了更为复杂、智能化的任务。VQA问题应运而生,这是一种同时涉及计算机视觉和自然语言处理两个不同领域的多模态学习任务。它要求系统能够把图片-问题对作为输入,理解图片中所有物体之间的逻辑关系,并根据问题生成对应的答案。腾讯公司首次将该任务应用于验证码设计,提出了一种称为VTT的新型验证码。每个VTT测试由一张图片和一个文本问题组成:图片中包含了利用渲染器合成的各种物体,这些物体具有不同的视觉属性,包括形状、颜色、大小、位置等;基于图片中物体的属性以及相互之间的逻辑关系,VTT测试将向用户提出一个文本问题,例如“请点击图中黄色方块左边的数字”。VTT的设计者对该机制进行了粗略的安全性评估,声称VTT比起传统的验证码具有更好的安全性。本文的工作将围绕验证码背后的AI问题以及验证码的安全性分析展开,具体包括以下三个方面:(1)以腾讯VTT作为主要研究对象,进行基于VQA任务的验证码安全性分析。考虑现实场景中对于速度以及准确率的需求,分别设计了两套不同的框架,并对VTT验证码进行了攻击实验。两种攻击方法分别实现了52.7%以及88.0%的破解成功率,证明了将VQA任务运用于验证码设计,仍然无法确保其安全性。(2)通过对攻击失败的样本进行综合分析,证明了机器在解决VTT中的“抽象属性”上,在目前仍然存在着巨大的缺陷。针对当前机器学习算法的缺陷,将抽象的“常识知识”与传统的图像识别以及自然语言理解任务融合,设计了一种全新的常识验证码。为验证新验证码机制的安全性,本文利用(1)中提出的两套框架,分别对常识验证码展开了攻击实验。结果表明了新机制有效的降低了攻击者的破解成功率。而随后进行的用户友好性实验中,良好的验证速度以及通过率表明常识验证码兼具良好的可用性。证明了在未来的验证码设计中,常识知识的潜力。(3)对当前主流的验证码机制背后所蕴含的AI问题进行了归纳总结,结合了本文工作中的攻击实验,对提升验证码安全性提出了一系列的设计意见,并对未来的验证码设计做出了展望。
其他文献
2020年是我国全面建成小康社会的实现之年,也是脱贫攻坚的收官之年。现阶段,减贫脱贫成为党和国家人民关注的重要问题。随着长期扶贫工作的开展,我国贫困人口不断减少,精准识贫、精准扶贫成为当下脱贫工作的重心。减贫脱贫的最终效果受多重因素影响。近年来,学术界基于多个不同的视角对农村减贫影响因素展开了研究,从经济、收入分配、财政支付等宏观层面以及教育、健康、工作经验等微观层面形成了大量的研究成果。贫困是由
2016年,“十三五”的第一年,更是提出了对电子档案信息化建设的更高要求。由此可见,电子文件管理系统的设计以及未来的开发应用,对于当前分析我国“电子文件系统”建设现状,
随着监测设备的广泛使用,在交通、气象、金融等领域均可采集大量的多维时间序列数据。时间序列具有随机性、连续性和周期性的特点,对时间序列进行预测分析,预测结果可以有效
随着社会经济的不断发展,人们的需求逐渐从物质需求转向精神满足,通过观看电影产品来满足自己的精神需求成了人们生活的常态。动漫电影产业作为文化创意产业的一部分,得到了政策的青睐。在过去的几年里,政府出台了一系列方针、政策、规划、纲要,为国产动漫产业的发展,打了一个很好的辅助。各种力量涌向动漫产业,为动漫产业的发展带来了机遇,但是“投入者”的盲目热情、“观众”的产品对比、“旁观者”的过分关注、以及“有形
在面临市场竞争及企业转型时期,制定适合企业的竞争战略对企业有重要的指导作用。近年来,随着国内都市型现代农业的不断兴起,对都市型现代农业的理解观念认识上不到位、竞争战略规划不科学、产业化经营不强、产品参差不齐、服务水平偏低、雷同严重等问题逐渐显现。京郊草莓博览园被北京市定位为发展现代都市农业的探索基地,为了探索现代都市农业发展,在草莓博览园策划了北京农业嘉年华活动。北京农业嘉年华活动是探索都市型现代
纺织业是我国的传统优势行业,发展历史悠久,市场化程度高,长期以来一直依靠我国廉价的劳动力获得很强的价格优势。但随着全球经济动荡源和风险点的增多,原料、用工成本上升,以及国家环保标准的提高,行业竞争越来越激烈,一系列问题喷涌而出:产品同质化、产能过剩、消费者需求个性化、出口和内需增长乏力等。纺织企业必须厘清自身优势和不足,顺应经济发展趋势,制定恰当的竞争战略,形成核心竞争力,才能实现企业的可持续发展
伴随着“智能高铁”时代来临,高铁列车及旅客对车内无线通信网络提出了越来越高的要求,传统GSM-R铁路专网已无法满足高带宽、低时延的多样化业务通信需求,因此向下一代铁路通
所谓的延迟退休,是指国家根据社会年龄结构、就业市场压力和养老保险基金收支的变化状况对退休年龄进行上调的政策。随着我国人口数量増速降低、人口老龄化也带来了一系列的社会问题,使得日益上升的养老金需求与并不完善的养老保险制度之间的矛盾愈发尖锐。除此以外,社会保障制度转轨带来下了大量债务和欠账,会严重影响养老金的支付能力。根据由中国社会科学院世界社保研究中心撰写发布的《中国养老金精算报告2018-2022
随着科技的迅速发展,各个领域的情报信息、研究成果产量迅速增长,而如何快速找到符合科技人员兴趣的信息成了亟待解决的问题。信息过载的现象加速了推荐系统的研究。情报推送技术旨在联系科技人员与科技文献、技术报告、新闻等情报信息库,为科技人员及时准确地推送符合其需要的情报信息。科技文献和技术报告等是科技人员了解当前技术前沿、学术动态的重要途径之一。针对仅从用户评分信息单一角度的推荐系统存在的冷启动问题,本文
在文献数据库中会存在许多相关性极低的论文,这些文章署名相同,但实际并不是同一个人,称之为同名问题,这严重影响了检索的质量。此外,同一个作者可能超过一个的名称变体,称之为共指问题,例如姓名缩写不同、工作机构调动,都会导致不完整的查询输出。这些都属于同名消歧问题。同名消歧的本质是一种利用知识库进行命名实体消歧,即将文本中的实体指称映射到知识库中对应字段的方法。本文中的命名实体识别特指科技文献作者识别,