基于聚类和分类的Android恶意软件检测研究

来源 :汕头大学 | 被引量 : 0次 | 上传用户:jinher123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Android智能手机越来越受大众的喜爱,Android恶意软件给用户带来的不良影响日益严重。为牟取利益而采取的恶意扣费、系统破坏、隐私窃取等恶意攻击手段层出不穷。如何有效的检测Android操作系统上的恶意软件是众多研究者所关注的一个研究重点。恶意软件分析技术主要包括静态分析和动态分析两类,考虑到时间效率等原因,本文基于静态分析来开展相关工作,提出了两种检测方案,并通过实验验证了它们的可行性与有效性。
  k-近邻算法(K-NearestNeighbor,简称KNN)的分类效果好,简单易实现;但计算量大,时间消耗长,尤其是在大样本数据的情况下。本文提出的第一种检测方案是基于改进KNN分类的恶意软件检测,主要是通过引入k均值聚类算法(K-meansClusteringAlgorithm,简称K-means)来解决KNN分类在计算方面的不足,可以在保证准确率的情况下尽量减少KNN计算所需要花费的时间成本。在该方案中又包含了引入混合聚类和引入分离聚类的两种改进KNN分类方案。同时对于大样本高纬度的数据集,本文提出了基于特征分类和特征频率的特征降维,可以有效减少计算量,消除冗余特征。
  Adaboost算法作为Boosting集成学习系列中最有代表性的算法,它充分考虑了每个分类器的权重,可以显著改善系统的泛化能力,且具有较高的精度,但是对噪音较为敏感。本文提出的第二种检测方案是基于互信息和MKAB的恶意软件检测。互信息可以度量两个变量的相关联程度。通过计算特征与类别之间的互信息,一方面,删除对于分类无效的特征以减少计算量,缩短检测时间,提高分类精度;另一方面,利用互信息对特征进行加权以区别特征的重要性。MKAB模型是结合MiniBatchK-means聚类和Adaboost提升树的方法。MiniBatchK-means聚类有助于局部改善Adaboost对于噪音敏感问题。相比较K-means算法,MiniBatchK-means在极小的精度损失下,可以大量缩减训练时间。在MKAB模型中,本文提出了基于距离权重对各分类器进行加权投票的策略,最终组合成强分类器。
其他文献
近年来,随着水下航行器的相关研究日益成熟,传统的水声传感器网络(Underwater Acoustic Sensor Networks,UASNs)常加入水下航行器组成异构UASNs,利用航行器的移动性完成大规模的海洋动态监测任务。然而,水声环境复杂多变和节点能量有限等特性使得异构UASNs中通信的可靠性和有效性较低。因此,本文对时间同步和路由协议两个关键技术进行研究。  针对现有异构UASNs中
高动态范围显示器使观看者能够体验到最高的图像质量,包括更高的对比度,更深邃的黑色状态,更高的灰度级和更鲜艳的色彩,是下一代显示器的关键技术之一。由于高动态范围显示器的使用增加,降低功耗、提高显示质量成为高动态范围显示的一大研究热点,为了对比度不足、黑色状态显示效果差问题,动态调光技术应运而生,将变暗的显示区域调暗,而无需将需要变亮的部分调暗,以此达到提高对比度、降低能耗、改善显示画质等目的。  为
作为人工智能的一个重要分支,进化计算是求解复杂最优化问题的主要途径。个体适应度评估是进化计算的重要步骤,个体适应度评估方法的可集成性、高效性以及精确性是影响进化计算可行性、实用性以及精确性的关键因素。本文针对因缺少可集成、高效的个体适应度评估方法而使得进化计算不能有效求解最优化问题这一瓶颈,对“盲评估进化计算方法”展开研究。首次提出个体适应度盲评估的方法,并基于个体适应度盲评估方法首次提出盲评估进
医学CT图像已经成为临床应用中不可或缺的诊断工具,然而医学CT成像过程中由于病人运动而产生的伪影是实现高精度诊断的最重要障碍之一,即使微小的运动也会对高分辨率CT图像带来较大影响,当运动伪影使图像质量严重下降时,可能会导致医生误诊。因此,消除医学CT图像中的运动伪影、提高图像质量成为目前图像处理领域的热点研究课题。  本文所做的主要工作如下:  (1)提出了基于频域幅度相关性的CT运动伪影校正方法
学位
本文以一个零售商主导的两级供应链为研究对象,构建两个生产竞争性或互补性产品的制造商是否采用无线射频识别技术(Radio Frequency Identification,RFID)时链上成员的收益模型,分析求解出各种情景下零售商定价/订货决策时制造商的最优批发价和RFID标签成本分摊系数,以及零售商的最优零售价/订货量,进而得出链上各成员的最大收益并探讨了两个制造商采用RFID的均衡策略。研究发现
群体智能优化算法是以动物社会为启发,主要通过群体协作行为使算法在问题的优化过程中更为有效。通常在解空间内,此类方法迫使群体中的所有个体进行某种合作,以便逐渐寻找出足够好的解,最终整体走向越来越好的解域。在群体智能优化算法中,根据人类的学习特点提出了人类学习优化算法,此算法运用不同层次算子之间的互相配合来寻找出全局最优解。它利用了人类学习新知识或新技能的特点,是一种十分有潜力的优化算法,往往能够产生
猪乙型脑炎病毒(JEV)是一种人畜共患的虫媒病毒,具有传染性和危险性,研究这类病毒需要一种安全的研究代替工具,假型病毒技术为解决这些问题提供了一种有效的研究手段。为了构建1种高包装滴度的JEV假型病毒,我们设计并包装出了3种乙脑假型病毒(JEVpv),分别是融合表达了水泡口炎病毒(VSV)囊膜蛋白强信号肽和JEV囊膜蛋白(ME)的VSVMEpv,带有乙脑自身弱信号肽及ME蛋白的SPMEpv,以及不
张等人为有效求解时变问题于2002年提出了一类特殊的递归神经网络—零化神经网络(Zeroing Neural Network,ZNN)。ZNN的提出解决了梯度神经网络(Gradient Neural Network,GNN)及其它传统方法在求解时变问题时,所合成的神经网络解无法精确收敛到理论解的问题。然而,在RNN的实现中,总是存在一些比理想情况复杂的实现误差,例如高概率出现的微分误差和模型实现误
无线传感器网络(Wireless Sensor Networks,WSNs)是人们感知世界获取多元信息的重要方法,已经被广泛应用到各种场景中,成为信息科学领域探索钻研的热点。但是,由于节点能量有限使得网络生命周期受到节点电池寿命的约束,所以与其它无线网络相比节能问题至关重要。数据链路层中的媒体接入控制(Medium Access Control,MAC)协议可以解决多个节点如何利用共享信道进行通信
近年来,机器学习在人工智能领域取得了巨大进展,但许多机器学习模型被构建为“黑盒”类型的模型,这种情况使用户很难去理解模型系统的内部逻辑。这种缺乏解释的情况既是一个实际问题,也是一个道德问题。模型可解释性在一些特定领域是有强烈需求的,尤其是在金融、医疗、反欺诈等领域。  模型可解释性的研究已经出现了一段时间,但目前对于机器学习的可解释性学习的研究,大部分研究存在于监督学习领域,尤其在近几年,深度神经
学位