基于集成学习的Android恶意应用检测方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:cm603
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Android的开源特性致使98%的恶意应用滋生在Android平台。为有效识别恶意应用,学者们探索了基于机器学习的检测方法。然而这些方法普遍在特征选择中使用单一的选择算法,存在丢失某些特征类别的风险;在分类中使用单个机器学习算法,无法确定最适合当前模型的算法。一些基于集成学习的工作提取特征较少,难以全面描述应用(APP)。同时,在网络级别的检测中流量数据庞大,但少有工作借助机器学习算法,且方法普遍异步地检测APP。针对上述不足,本文首先提出了基于本地行为和集成学习的Android恶意应用检测(Mlifdect)。方法将本地行为细化为“APP独立的特征”和“平台定义的特征”,引入两种特征选择算法分别挑选它们;接着使用三种不同的机器学习算法分别搭载生成的两类特征数据集,构建六个基分类器,多线程并发执行分类任务;最后调研了Dempster-Shafer(DS)理论和概率分析的两种集成策略。实验中,Mlifdect的准确率和召回率均接近99.7%,并以少量硬件开销换取时间的优化。其次,本文提出了基于网络行为和集成学习的检测模型。该模型是一种多标签分类问题,从流量数据中提取了数量、时间、语义性质的16个特征,并维护流量所属APP属性,以“特征+属性+APP标签+流量标签”的方式构建特征向量,使用Mlifdect中的三种机器学习算法分类,通过DS理论集成,完成了流量与对应APP的同步分类。实验证明该模型准确率达到97%,并将异步操作转化为同步行为,节省了计算开销。最后,本文分别对本地和网络行为展开了细粒度分析,探索恶意应用与正常应用行为特征的差异;随后,本文提出特征持久化概念,并通过时间序列实验与数据分析发现Android恶意应用的本地行为特征随时间推移变化较为明显,持久性相对欠缺。
其他文献
内蒙古北山地区位于我国西部边陲,研究区位于百合山-蓬勃山蛇绿岩带南侧,区内岩浆活动具有演化时间长、岩石类型复杂、构造背景多变的岩浆演化特点。本文选取标山一带南北向
近年来,随着智能手机、车载定位设备等一系列基于位置终端设备的迅速普及,每年全球都会产生大规模的空间位置信息,基于位置服务的应用与人们的生活出行密切相关。空间数据具
近年来,围绕优化营商环境这一重要目标,推进政府信息公开、提高政府透明度成为了政府工作的重要内容之一,相关研究也开始讨论政府信息公开对营商环境的作用及影响,但无论是实务工作还是已有研究,都缺乏对这一问题在实证上的回答与检验。同时,在政府信息公开分类管理的普遍呼吁下,将政府信息公开作为一个整体也会忽略不同类型的政府信息公开可能对营商环境产生的不同影响。因此,在实证研究的基础上回答“是否所有的政府信息公
本文对基站配备大规模天线阵列的毫米波通信系统进行了物理层相关安全技术的研究。毫米波通信系统中基站处配备了大量天线,由于系统硬件成本限制,需要寻求成本可控的预编码方
柳林区块位于鄂尔多斯盆地河东煤田中部,煤层发育层数多且稳定,厚度大,含气量高,地质条件相对较好,勘探开发潜力巨大。论文在收集并利用地质资料分析的基础上,采用多学科相结
近年来,Android应用程序的安全问题越来越严重。据统计发现,将近98%的移动安全问题出现于Android平台。其中,主要的安全威胁来自于重打包应用。重打包应用不但严重损害开发者
近几年,随着无线技术的发展和移动通讯设备的普及,智能手机已逐步成为多数人日常生活和工作无法替代的必备工具,然而智能手机耗电速度快、续航时间短等问题严重影响着用户体
混凝土可被视为一种多尺度材料,在细观尺度上,它通常被认为是由骨料、水泥浆基质和二者间的界面过渡区(Interfacial Transition Zone(ITZ))组成的三相复合材料。各组分的相对
锰基、铁基ABO_3型复合氧化物作为一种新型功能材料,已广泛应用于新型传感器、燃料电池、磁性材料、铁电材料、催化及环保等领域。随着ABO_3复合氧化物应用领域的不断扩大,制备不同结构组成的ABO_3氧化物已成为钙钛矿材料合成的重点课题之一。近年来,钙钛矿材料的掺杂已成为新的研究热点,但对于ABO_3掺杂后其光催化性能和磁学特性的系统研究尚不完善。因此,探索ABO_3掺杂后其光催化性能和磁学特性的研
随着物联网技术的飞速发展,物与物、人与人、人与物皆可相连,相连所产生的各种信息的价值越来越高,这些信息吸引了越来越多的恶意攻击者,给网络的安全带来了严重威胁。而作为