面向移动恶意应用流量的非平衡识别方法研究

来源 :济南大学 | 被引量 : 0次 | 上传用户:dafeidafeifeida
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动网络的高速发展,以智能手机和平板电脑为主的智能终端的数量呈指数级的增长。智能手机的普及给人们的生活带来了诸多的便利,同时也存在着许多安全问题。近年来,恶意应用日益猖獗,给用户和社会带来了极大危害,也给网络安全与管理带来新的挑战。而大部分的恶意应用通过网络执行恶意行为,因此,分析移动应用产生的恶意流量成为安全领域研究的热点。近年来,基于机器学习的流量识别技术日趋成熟,这使得从机器学习与网络技术的角度对恶意流量准确识别成为可能。然而应用机器学习技术,研究有效的恶意流量识别方法,数项关键问题却亟待解决:(1)恶意流量特征提取问题。随着技术的发展,采用传统特征对恶意流量的识别率已经不能满足实际需求。(2)包抽样问题。在高速网络环境中,网络的速率越来越快,采集和处理完整数据流相当困难;包抽样技术的发展给流量识别提供了一种新思路,减轻了计算机的负担。(3)非平衡流量分类问题。从互联网中流量分布角度来看,正常流量远远高于恶意流量,直接采用标准的分类算法更倾向于对正常流量的准确识别,分类器获得的性能往往不尽人意。针对恶意流量识别中的以上问题,本文将从以下几个方面开展研究工作:首先,针对恶意流量特征提取和评估问题,本文分别从数据包层面和内容层面提取了特征,采用机器学习算法对数据集进行训练,并构建有效的恶意流量识别模型。其次,针对样本抽样问题,本文在早期恶意流量识别中,采用了数据包抽样技术,结合分类算法验证了样本抽样在流量识别中的有效性。最后,针对非平衡分类问题,本文从数据层面的角度出发,提出了三种解决方法。(1)本文提出了一种基于对抗生成网络的样本再生成方法,通过网络的对抗训练学习真实数据的潜在分布并合成少数类样本,结合机器学习算法验证了方法的有效性。(2)本文提出了一种非线性加权差异化样本重采样方法。该方法构造出一个在能反映少数类的安全样本和边界样本对分类有不同作用的函数,计算每个少数类样本的权重和采样率。然后,结合SMOTE算法对样本进行过采样并验证了算法的有效性。(3)本文提出了一种基于差分进化的改进的SMOTE算法。通过差分进化算法智能地搜索最优的采样率取值组合,然后根据该组合对数据集进行SMOTE采样。实验表明,该算法在解决非平衡问题上是有效的。
其他文献
可满足性问题(即SAT问题)是第一个NP完全问题,这一个典型且著名的判定问题早在1971年的时候就已经被S.A.Cook证明出来。SAT问题不仅是逻辑学的一个基本核心问题,在计算机的理
研究背景及目的:肿瘤蛋白p53诱导的核蛋白2(Tumor protein p53-inducible nuclear protein 2,TP53INP2),是调节自噬小体形成所必需的一种蛋白,与包括肿瘤在内的多种疾病发生相关,而其在膀胱癌中的作用及机制尚不清楚。本研究旨在探讨TP53INP2对膀胱癌生物学功能的作用及机制。实验方法:荧光实时定量PCR用于m RNA表达水平检测,免疫组化和蛋白质免
随着经济全球化和科学技术的快速发展,企业的生产规模日益扩大,设备的结构越来越复杂,功能越来越完善,自动化程度越来越高。在设备运行中,设备会由于疲劳、磨损、老化以及动
我国在针对电力企业进行考核的过程中会参考多种不同的指标,而线损率就是其中之一,该指标可以综合反映电力企业运营的情况,比如说电网的发电、输电、变电、配电、用电等各个环节的管理运行情况,是电力企业管理水平的综合反映,同时这也是提高电力企业经济效益的核心指标。随着国有企业的深化改革,输配电价改革进一步推进,电力企业必须加快降损增效,提高管理水平,这对如何得到精准的线损率数据,如何分析数据并得到有效降损方
随着全球经济的迅猛发展,全球一体化日益加剧,银行业作为金融行业的龙头规模也在不断扩张。但是在网络金融兴起、利率市场化加剧和经济增速放缓的趋势和大背景下,银行业面临着新的挑战。财务管理作为商业银行生产经营的一项至关重要内容,各大商业银行开始纷纷研究和探索适应新外部环境的财务管理模式。财务集中管理作为较为先进的财务管理模式开始逐步在大型企业应用,财务集中管理模式改变了原企业经营的组织结构,由原来横向垂
麦克风阵列声源定位一直是语音信号处理领域研究的热点之一。阵元域经典的声源定位方法会随着噪声和混响恶化而性能下降,精度无法满足实际需要,且算法的时间复杂度较高,不利
大型软件的调试往往需要花费大量人力和时间,因此自动化的软件故障定位方法成为更好的选择。现有故障定位方法大都基于用例的覆盖信息进行分析,没有完全考虑测试用例运行时的
随着多媒体数据在互联网当中的爆炸性增长,如何有效地组织和管理海量的多模态数据成为了一个亟待解决的问题。解决问题的关键在于挖掘多模态间的潜在关联关系,而其实质在于搭
随着我国各大城市轨道交通新线的密集开通和网络化运营的持续推进,OD对间可供乘客选择的路径不断增加,换乘客流在全网中的占比不断提升,在一票制“无缝换乘”模式下掌握乘客的路径选择及换乘客流的时空分布规律,对均衡客流分布、提高运营效率至关重要。本文主要针对城市轨道交通中换乘网络内“模糊换乘”OD对间乘客的路径选择的问题进行研究,基于时空网络描述特定时空棱镜下的有效路径,通过对AFC数据的挖掘和分析,推演
水杨醛类席夫碱配体具有很强配位能力的氮原子(亚胺基C=N)和氧原子(酚羟基Ar-O),易于与不同种类的金属离子形成多种配位方式的席夫碱配合物,因此在配位化学中有一定的研究价