基于网络流量的Android恶意应用识别方法研究

来源 :济南大学 | 被引量 : 2次 | 上传用户:tuifei213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,移动互联网迅速普及,各种应用的产生给人们的生活带来了极大的便利,然而这也滋生了恶意应用的不断发展。恶意应用的规模和多样性在不断增加,对用户的隐私和财产安全带来巨大的隐患。针对Android恶意应用的检测方法,大体上可以分为静态代码分析、动态行为分析和流量行为分析。静态代码分析通过识别恶意代码段检测恶意应用,这种方法简单有效,但在应对加壳的应用和代码混淆的应用时会失败。动态行为分析监控应用执行过程中的事件和行为,但由于复杂度太高,很难大规模的应用和部署。基于网络行为的恶意应用识别方法通过捕捉用户的网络流量数据分析恶意行为。这种方法易于实现,不依赖用户,不消耗用户资源,是比较有前景的研究方法。然而,基于网络流量分析的恶意应用识别方法也面临着一些问题,其中比较突出的问题就是特征选择困难和识别准确率低。本文通过分析大量的网络流量数据,总结了多组网络流量特征,首先是挖掘了TCP流的6个统计特征,并对每一维特征进行预处理操作,研制出了一份TCP流统计特征集。这份数据集不涉及到流量内容,可以保护用户的隐私以及有效的检测加密的网络流量数据。其次是创建了HTTP请求字段特征集,从HTTP请求头部筛选了4个字段,分别进行预处理,研制出了一份HTTP请求字段特征集。针对HTTP头部信息,采用文档处理的方式,对头部信息进行分割、获取N-Gram序列、特征自动选择等操作,最终研制出了一份HTTP头部N-Gram特征集。此外,针对URL字符串,采用字符串分割、单词词向量训练等方法创建了一个URL特征集。这四份特征集覆盖了TCP流量、HTTP流量以及URL字符串等网络流量的多个层面。本文接下来使用研制出的不同特征集并结合不同的机器学习和深度学习算法创建了多个有效的恶意应用检测模型。利用TCP流统计特征集和HTTP请求字段特征集并结合决策树算法创建了两个互补的恶意应用检测模型;利用HTTP头部N-Gram特征集并结合支持向量机算法创建了一个有效的恶意应用检测模型;针对URL特征集,结合多视图神经网络创建了一个有效的恶意应用检测模型;并结合浮动质心方法创建了一个有效的恶意应用检测和聚类模型。针对每个检测模型,本文都设计了大量的评估和对比实验,以验证模型的效果。本文还将模型应用到真实的环境中去检测未知的Android应用,实验结果也证实了特征集和模型的有效性。此外,为了方便对应用和网络流量的管理,本文设计并实现了一套Android应用与网络流量管理平台。通过调用VirusTotal的检测接口,可以实现大批量的应用上传与检测功能。针对Android应用产生的网络流量数据,本文在系统中集成了多种常用的流量处理操作,比如TCP流提取、HTTP流量提取、DNS流量提取、URL字符串提取等。此外,系统还集成了多种机器学习算法和深度学习算法,用户只需选择要使用的算法,就可以实现对数据的建模。另外,用户还可以同时选择多种算法,多种算法的对比结果以可视化的方式展现给用户。
其他文献
【正】 我国是一个历史悠久,幅员广大,“由多数民族结合而成的拥有广大人口的国家”。在中华民族统一国家形成过程的反复斗争中,各族人民都做出了应有的贡献,并在斗争中形成
采用硫酸为浸出剂,对高炉炼铁烟尘进行未活化和活化浸出工艺研究.通过正交试验与单因素试验相结合考察硫酸浓度、浸出温度、浸出时间、液固比对烟尘中锌浸出率的影响.结果表
金融问题涉及政治、经济、社会、人类行为等多个领域,如果仅仅从法律层面出发,并不能使滋生犯罪的诸多时代元素与作为犯罪治理手段的刑事检察很好地相互适应。在金融检察过程
蔗渣纤维素是地球上丰富的再生性资源,利用改性后的蔗渣纤维素作为吸附剂,是实现对植物资源的高附加值利用的重要途径之一。以甘蔗渣为原料,碱化后,与3-氯-2-羟丙基三甲基氯化铵
目的比较Holter和普通心电图对于冠心病的诊断价值。方法随机选择300例冠心病病人,分别做12导联Holter(动态心电图)和普通12导联心电图,统计两组发生各种心律失常类型的人数,
燃煤机组的锅炉过热器换热管道中包含有大量金属蓄热储能,利用过热器金属蓄热可以快速改变机组发电负荷和主蒸汽压力.通过减温水扰动试验,获得一级减温水流量对负荷以及主蒸
【正】 黄遵宪是近代资产阶级改良主义运动的积极活动家,也是卓越的爱国主义诗人。他的古近体诗六百多首,收在《人境庐诗草》中,是我国近代文学中一笔很可宝贵的文学遗产。四
<正>目的:在张建新等修订的中国人复原力问卷的基础上,再次补充汶川地震后对震区青少年学生以及教师的访谈结果,对问卷进行修订,成为适合灾难后青少年的复原力问卷。方法:研
教育部规定自2010年9月1日起,全部中国政府奖学金本科学生必须接收一年的汉语预科教育,一年以后必须通过汉语水平考试4级(HSK4),因而,在第一年顺利通过HSK4级成为这些政府奖学
发展物流产业要考虑应具有合理的指导思想及精确的前瞻性。使企业的购存销达到准确的预测,使物流费用最少,社会经济效益最佳,尤其是对用户的服务质量最好,是物流管理所要研究的主