基于异构图特征的安卓恶意软件检测研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:yurui4010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
安卓系统是目前最主流的移动端操作系统,占据了83.8%的移动终端市场。统计表明,2021年新增安卓恶意软件约337.06万个,比2020年增长了近10%,用户的信息和资产面临着极大的威胁。因此,安卓恶意软件检测研究引起了学术界和工业界的广泛关注。安卓恶意软件检测的关键在于特征的构建。基于API调用或字节码构建的语义特征能较好地刻画安卓软件的行为模式,因此得到了广泛的应用。现有语义特征主要使用同构图或异构图结构的数据表示。相比同构图,异构图能嵌入更多的语义信息,因此异构图特征可以更加充分地刻画安卓软件的行为模式。为准确地识别安卓恶意软件,本文提出了一种基于异构图特征的安卓恶意软件检测算法,在与同类方法的对比实验中取得了最好的性能。本文的主要研究内容及贡献如下:(1)为了更充分地刻画Android软件的行为模式,本文提出了一种新颖的异构图特征的构建方法,使用“APP”、“入口函数”和“Android API”三种类型的节点构成异构图特征,增强了语义信息的嵌入能力。(2)考虑到Android API在代码中的位置信息有助于刻画软件的运行时行为,本文提出将Android API在当前“入口函数”中的调用顺序以位置编码的形式存储在异构图中相应的“调用边”上,并带入图卷积神经网络计算,使提取到的特征包含Android API的位置信息,从而提供更丰富的语义信息。(3)本文与基于图特征的安卓恶意软件检测算法E-FCG、Ma Ma Droid、Malscan和APIGraph进行了对比实验。在包含11351个样本的数据集上,本文所提出的算法取得了95.97%的最高F1-分数。在模拟模型老化的实验中,使用老旧数据集训练,新数据集测试,本文所提出的算法平均F1-分数达到了89.44%,显著高于对比的算法。最后,通过在以上两种数据集上进行消融实验,本文验证了“入口函数”和“Android API位置编码”对安卓恶意软件检测的重要性。
其他文献
随着近年来基于位置的服务(Location-based Services,LBS)的发展,人们对位置隐私保护问题的关注度越来越高。位置和轨迹数据通常会包含用户个人的敏感信息,直接发布会对用户隐私造成威胁。差分隐私(Differential Privacy,DP)作为一种具备坚实数学基础的隐私保护方法,在位置和轨迹数据发布中得到了广泛的应用。然而,现有的位置差分隐私发布机制,大多数只考虑静态场景的位
学位
如今视频传输已占据因特网中绝大多数的带宽,传统的视频组播方式会产生大量的带宽浪费。而新兴的大规模多层低地球轨道(Low Earth Orbit,LEO)卫星网络可以通过星间链路进行带宽优化的视频组播,显著减少流量浪费。目前对于卫星网络组播路由的研究集中在IP组播,但其路由性能和可拓展性有限,并不适用于大规模卫星网络。新兴的软件定义组播(Software Defined Multicast,SDM)
学位
证照作为公民的身份凭证,在金融、交通和医疗等领域都应用广泛。由于人工查验效率低下,难以适应日益加快的国际化进程,因此亟需实现证照的自动化查验。然而,证照种类繁多,版面结构复杂多样,证照表面印有复杂的背景图案和防伪特征并且常常出现字符污渍和缺损等情况,给现有算法带来了巨大的挑战。针对以上问题,本文提出了一套适用于证照的结构化识别算法。针对证照中细长文本检测困难问题,本文提出了一种分组多路可选择卷积,
学位
随着基于位置的社交网络平台的发展,产生的大量含有时空信息的签到数据给用户行为特征研究带来了新机遇。作为最具代表性的研究之一,跨社交平台用户身份匹配推动了用户跨域信息融合,促进了更优质的商业服务和个性化推荐质量,因此引起了广泛的研究关注。然而,在处理时空签到数据时,现有工作大都使用离散化方法,忽略了时空本身的连续性,导致严重的边界效应,影响算法性能。为了解决该问题,本文提出了基于关联位置连续签到模式
学位
慢性阻塞性肺疾病,简称慢阻肺疾病,是一种常见的慢性呼吸系统疾病。该疾病会让患者严重丧失劳动能力,这给患者的家庭以及社会带来沉重的经济负担。中医治疗慢阻肺疾病具有毒副作用小且标本兼治的优点,能够极大缓解慢阻肺患者的症状。目前我国的慢阻肺疾病患者基数大,有经验的中医数量不足,导致中医慢阻肺医疗资源面临着巨大的压力,因此研究慢阻肺中医智能诊疗尤为迫切。针对慢阻肺中医智能诊疗中的证型和症状多样化,且证型相
学位
零样本图像分类旨在解决缺失训练样本的未见类图像的分类问题。虽然近年来以监督学习范式在大规模数据集上训练的深度神经网络在图像分类等计算机视觉任务上取得了显著的性能提升,但是这些分类模型局限于训练集中出现过的已见类,无法对缺失训练样本的未见类进行有效地识别。然而,实际应用场景中不可避免地存在因为标注成本过高、样本稀缺、类别随时间变化导致的未见类图像样本的出现。为了解决此类问题,零样本图像分类方法期望借
学位
自互联网诞生以来,研究如何在海量的图像数据中检索出用户所需要图像的图像检索一直是计算机科学的一个基本问题。随着智能触屏设备的普及,草图逐渐成为一种重要的媒体模态,并使得草图检索成为一个热点研究问题。已有的草图检索只能检索在训练集中出现过的类别的草图。然而作为一个实际应用问题,在实际使用时很难保证训练集能够覆盖到所有的待检索类别。零样本草图检索任务,则要求计算机能够对训练集中未出现类别的草图实现草图
学位
在食品、药品等领域,产品外包装上必须附带如生产日期、有效期限、生产批次等印刷文本,其重要意义是明确保质期、保留可追溯途径。存在错印、漏印等质量问题的印刷文本会给企业带来法律风险。传统人工抽检方式存在开销大、漏检率高的弊端,而使用机器视觉技术能够实现更智能、更高效的解决方案。本文研究端到端的文本检测识别算法,并研发了一个印刷文本视觉检测识别软件系统。主要工作如下:(1)针对激光打印文本存在对比度低的
学位
慢性阻塞性肺疾病,简称慢阻肺,是最常见的慢性呼吸病,其较高的发病率和死亡率给社会带来了沉重的负担。中医治疗慢阻肺具有疗效精准、副作用小的优势,规范的中医治疗是降低疾病负担的关键。目前我国慢阻肺患者基数大、合格的中医生数量不足,因此针对慢阻肺的中医智能诊疗研究具有重要现实意义。针对慢阻肺中医诊疗数据集缺乏问题,本文首先设计了一种全新的慢阻肺患者信息录入形式,并对湖北省中医院肺病科近五年来(2016-
学位
利用水下拖曳天线辐射电磁波是实现跨海面-空气界面通信的一种重要手段。本文深入地研究了海水中拖曳天线海面上方产生的电磁场分布,并分析了电磁波传播到海面上方后继续向远距离传播时的传播方式及其传播损耗,同时也揭示了拖曳天线长度、天线深度与天线姿态等因素对拖曳天线跨介质面远距离通信性能的影响。本文主要研究工作和结论如下:1)建立海水-空气两层媒质中电偶极子的辐射模型,基于矢量磁位法推导水平放置、垂直放置、
学位