不平衡多变量可变长度的鼠标轨迹识别方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:jeff2047
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网行为式验证码技术的发展,以拖动滑块为代表的鼠标轨迹识别因其传输数据小、暴力破解难度大等特点,广泛运用于多种人机验证产品中。但是攻击者可通过黑产工具产生类人轨迹批量操作以绕过检测,并在对抗过程中不断升级其伪造数据以持续绕过同样升级的检测技术。因此可利用机器学习算法建立有效的鼠标轨迹识别模型,以提高人机验证中各种机器行为的检出率。鼠标轨迹是用户拖动滑块时采样获得的水平方向x、垂直方向y和时间t三个维度的轨迹点集,不同于传统时间序列,它具有多变量、可变长度、数据不平衡、标记样本少等特点。由于这些特点,使得传统的时间序列分类方法并不能直接应用于鼠标轨迹识别,当前有关鼠标轨迹识别方法也未能针对这些特点进行系统性解决。基于此,本文对鼠标轨迹识别问题进行了深入研究,提出了一种结合特征组分层和半监督学习的鼠标轨迹识别方法。主要研究内容如下:1.针对鼠标轨迹多变量、可变长度的问题,采用基于特征的方法,从不同视角构建基础特征和辅助特征。具体地,从t-x维度提取特征作为基础特征,用于描述人机轨迹差异性;从t-y维度提取特征作为辅助特征,用于辅助判断,增加轨迹识别置信度。此外,为进行特征降维,提出了一种改进的基于随机森林的包裹式特征选择算法。该算法首先对随机森林特征重要性度量方法进行改进,解决数据不平衡时给多数类权重过高的问题,然后将特征按重要性得分降序排列,剔除尾部不相关特征,最后采用序列后向选择方法,从后向前遍历删除每个特征,并使用包裹式评价方法对特征子集进行评估,以判断是否收回删除特征。实验结果表明,该方法优于传统特征选择算法,可有效去除冗余特征。2.针对当前鼠标轨迹识别效果不理想,存在数据不平衡、标记样本少等问题,提出一种结合特征组分层和半监督学习的鼠标轨迹识别算法。具体地,该算法在特征层面,采用特征组分层策略,将基础特征组和辅助特征组分层添加进模型;在数据层面,基于半监督学习思想扩充训练数据集,并结合随机欠采样以改善数据类别不平衡问题;最后将二者融合达到提升识别效果的目的。实验结果表明,该算法的精确率达到96.26%,召回率达到91.63%,调和均值达到94.35%,证明该方法对鼠标轨迹识别的有效性。
其他文献
随着我国经济的飞速发展,企业规模的不断壮大,公司间的竞争越来越激烈,许多公司为了增强自身的竞争力,常通过转投资的方式来扩大自身的规模。母子公司交叉持股就是最常用的方
“911”恐怖袭击发生之后,大型商用客机恶意撞击核电站的安全评估问题逐渐成为国内外的核电设计关注的热点之一。国外对大型商用飞机恶意撞击核安全壳的载荷问题已经进行了很
作为当今动物界最大的一个门类,节肢动物是研究生物演化和破解寒武纪生命大爆发之谜的重要一环。而在寒武纪特异埋藏生物群与化石库中,由于属种较少且结构复杂难以完好保存,双瓣壳节肢动物是稀有的化石保存类群。至今它们的头部结构分节尚存在争议,但学术界普遍认为这些经典的双瓣壳节肢动物具有非常接近的亲缘关系(Budd,2002;Legg et al.,2013;Aria&Caron,2017)。由于近年
无线通讯技术和嵌入式计算技术在近些年的高速发展使得传统控制系统中的有线通信逐步被无线通信所取代,形成了所谓的无线网络化控制系统。该类系统具有低成本、高灵活、易实
图像压缩是信息处理领域重要的研究课题。分形图像压缩充分利用图像冗余和自相似的特性,在保证高的压缩比的同时能够获得较好的重构图像质量。然而,基本分形压缩编码在进行图
思想政治课的生活化教学是近年来的热点问题,人们开始了对生活化教学的更多关注,根据思想政治课生活化教学的含义及意义,寻找生活化教学在思想政治课教学中的运用,也成了思想
移动网络与智能终端的飞速发展,催生云游戏、虚拟现实及图像识别等多元化计算密集型应用的接连涌现。但是,各类新兴应用的密集计算需求对移动智能设备任务计算能力提出巨大挑
调频连续波(Frequency Modulated Continuous Wave,FMCW)雷达由于具有无距离盲区、测距精度高且结构简单等优势,使其应用领域逐渐从军用走向民用。随着FMCW雷达的广泛应用,对
优生优育对于降低新生儿的先天畸形概率,提升生殖健康水平,乃至提高全民的整体健康水平,均具有重要的现实意义。目前,优生优育临床检测的主要标志物称为TORCH五项,分别为:弓
受到构件干涉、运动奇异等因素的影响,传统并联机构的工作空间一般比较小,某种程度限制了并联机构的应用范围。课题组通过匹配耦合支链以增大并联机构输出空间的方法,综合并获得了一批新型耦合并联机构——双并联耦合机构。本文主要针对该类新型大工作空间双并联耦合机构以及基于一种球面双并联耦合机构研制的4-RRR//RRR+R冗余支链混联球面仿人肩关节机构的部分性能特征进行研究。推导了双并联耦合机构的转动和移动叠