基于多特征的Android隐私安全研究

来源 :四川大学 | 被引量 : 0次 | 上传用户:test1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的十年中,智能手机的普及极大地促进了移动应用程序的发展。根据我国工信部的数据,截至2020年9月,我国已经有9.4亿的手机网民,月活跃设备数14.3亿台,国内市场上的移动应用程序数量达到了 357万款。人们已经习惯了使用手机应用处理各种事情,许多用户在他们的移动设备上存储了大量敏感的个人隐私数据,这些数据面临被恶意泄露的风险,这已成为整个移动应用程序生态系统的主要威胁。本文对Android应用程序的用户隐私安全进行研究。目前关于Android应用程序隐私安全的研究工作主要有基于文本和基于程序代码的两种方法,但是这两种研究方法都存在着各自的问题。基于文本的方法一般只对App的描述文本进行分析,在描述文本中提取出应用程序的功能信息用于推断应用程序的合理权限集合,但是由于程序描述并不能完全说明应用程序的功能特征,其结果可能把应用程序合理的权限判断为过度声明的权限。而基于应用程序代码的方法没有考虑到应用程序的文本中隐藏的功能特征,对于不同功能的App其恶意泄露用户隐私的程序行为是不一样的,导致这种方法的检测结果往往不够准确。无论应用程序的文本或是程序代码,其实都在一定程度的反映了应用程序隐私安全信息。本文旨在研究如何分析Android应用程序的多维度的信息,从中提取出有效的特征,从而更加准确的评估应用程序的隐私安全风险。本文的研究主要包含以下三个方面:(1)数据采集与预处理由于本文的研究需要分析应用程序的文本和程序数据流。而现有研究大多只针对单一特征进行用户隐私安全研究,其收集的数据集都不能满足本文的需求,因此需要对实验相关应用程序数据进行采集和处理。本文通过爬虫收集到了 1668个良性App和783个恶意App的描述文本和APK安装文件,通过反编译和静态代码解析从APK文件中提取出App的界面文本和隐私权限信息,最后对收集的文本信息进行了一定的预处理。(2)基于文本的隐私权限安全检测现有对于检测应用程序权限过度申请(过权限)问题的研究方法主要是对应用程序描述文本进行分析,由于程序描述并不能完全说明应用程序的功能特征,可能会把应用程序的合理权限误判为具有隐私泄露风险的权限。针对这个问题,本文在通过LDA主题模型提取应用程序的功能特征的基础上,增加了 UI元素上下文信息,使用基于关联规则的Apriori算法找到界面文本关键词与隐私权限的映射,从而结合描述文本和界面文本的信息分析出应用程序的合理权限集合,减少现有基于单一描述文本的方法对于过权限的误判。(3)基于多维特征的隐私安全检测基于应用程序文本的分析方法,只能得到一个应用程序是否有过权限的风险,并不能判断程序是否有泄露用户隐私的恶意行为。现有基于程序数据流分析的方法在隐私泄露恶意行为检测方面取得了不错的成果。但是单一对程序数据流进行分析没有考虑到应用程序的文本中隐藏的功能特征,而且这些检测方法使用单一的机器学习模型进行恶意检测,其检测的结果往往不够准确。本文在基于静态代码分析程序数据流特征的基础上,使用CCA典型相关分析算法融合了应用程序的文本特征,并把集成学习的思想应用于泄露用户隐私恶意行为的检测上,使用集成学习的Stacking算法结合多种机器学习判别模型,对文本和数据流的融合特征进行分析,提高了 Android应用隐私安全检测的准确率。
其他文献
变循环发动机以能够满足高单位推力和低循环耗油的性能要求,成为未来民用及军用飞机动力装置的的理想选择,其发动机运行状态健康稳定,是飞机始终安全飞行的重要保证。由于,发动机工作状态和外部条件十分苛刻,随着工作时间的增长,发动机的状态可能会或多或少的偏离稳定轨迹,其性能参数会出现渐变退化导致更严重的故障发生。而气路部件性能退化故障是变循环发动机的主要故障类型,所以对变循环发动机气路部件性能退化状态参数监
随着我国的城镇化和人口流动向各大中型城市聚集,人们对住房要求的提升,长租公寓应运而生。长租公寓主要指由机构经营管理的房屋租赁的一种模式,长租公寓一般具有规模化、高品质的经营特点,为需要租赁住房的客户提供住宅租赁服务,这种房屋租赁形式,已经成为我国房地产市场经济发展的方向。近年来,各地政府从国土、金融、税务等各个方面均制定了相应政策,以鼓励长租公寓行业的发展。但在长租公寓迅猛发展的背后,其中涉及到的
汽车工业的发展,对乘员舒适度以及节能减排的要求越来越高。汽车行驶中,工况一直处于变化状态,准确高效的匹配空调系统显得尤其重要。本文采用三维和一维软件相耦合的方法,力求更准确的反映出空调系统在不同工况下的降温性能,为前期部件选型和后期设计优化提供有力的支撑。三维CFD中流场计算,用于获得不同整车工况下的冷凝器空气进口参数,以及乘员舱内的气流分布;使用一维软件建立整个空调循环,对零部件参数进行敏感性分
背景肺纤维化是脓毒症相关性ARDS的重要病理过程,以肺成纤维细胞异常增殖活化、大量细胞外基质广泛无序聚集和胶原蛋白沉积为特征。革兰氏阴性杆菌内毒素的成分脂多糖(lipopolysaccharide,LPS)在脓毒症相关性肺纤维化中发挥重要作用,但LPS引起脓毒症相关性肺纤维化的详细机制未完全阐明。本实验拟通过构建LPS诱导脓毒症相关性肺纤维化的细胞和动物模型,探讨LPS诱导肺成纤维细胞异常代谢过程
颤振问题最早出现在航空领域,近些年来,随着海洋航行器的发展以及海洋强国政策的大力推行,水翼的颤振问题逐渐受到重视。与机翼的情况类似,设计不当的舵会诱发颤振。除了经典颤振,低航速的舵还会发生弱颤振现象,它的危害并非引起舵系统的结构破坏,而是诱发水中噪声,提升水下航行体航行的噪声等级。尽管对飞行器和桥梁等结构在空气中的振动理论及相应的试验方法已经相当成熟,但舵翼系统流激振动理论及相应的试验问题对我国水
反作用轮作为卫星重要执行机构,在轨运行时间长,贯穿卫星的整个寿命周期,影响卫星任务成败,因此对于反作用轮的健康状态进行检测十分必要。本文主要对卫星反作用轮的故障检测方法进行研究,研究采用基于解析模型和基于知识的两种方法进行。基于解析模型的方法方面,文中提出了一种基于双无损卡尔曼滤波(Dual-UKF)的反作用轮故障检测方法。该方法利用双无损卡尔曼滤波器估计反作用轮的关键参数实现故障检测。该方法精度
量子点因其具备发射波长可调,高量子效率和高颜色纯度等特点,被广泛应用于显示器件、太阳能电池、LED照明及生物成像、检测等多个领域。由于量子点随尺寸降低,比表面积增大,表面原子占比高容易产生表面缺陷态,导致其量子效率降低,因此常用包覆无机半导体壳层的方法提高其效率和稳定性。核壳结构量子点常用的包壳方法为连续离子层吸附反应,产物光学性能优异,壳层精确可调,但该方法繁琐,耗时较长,不利于实际的应用和推广
结构受力构件在偶遇或意外荷载作用下失效引起周边甚至整体结构的连锁失效反应被称为连续倒塌。比如在框架结构中,一旦承重柱由于地震、车辆撞击、火灾或其他自然或人为危害而被削弱或失去承载能力,该柱所承担的荷载将转移到相邻柱上。如果相邻柱在设计过程中没有充分考虑荷载重分布或具备承担额外荷载能力,则该构件也将失去其承载能力,竖向荷载将导致相邻构件相继失效直到达到平衡并稳定为止。因此,连续倒塌现象将导致结构出现
航空发动机是飞机动力系统的核心组件,其可靠性和稳定性是航程安全的重要保障。由于长期处于高温高压的工作状态,发动机性能退化的现象无可避免。为兼顾安全风险的规避和维护成本的控制,建立有效的预测诊断与健康管理机制意义重大。得益于近年来机器学习领域的快速发展,利用数据挖掘技术预测发动机剩余可用寿命的研究方兴未艾。本文以航空发动机退化过程中多源性能参数的监测数据为源信息载体,将传统信号处理方法与数据驱动的算
乳清分离蛋白(Whey protein isolate,WPI)是一种从牛乳中提取的混合蛋白,常作为功能性食品配料被广泛应用于食品生产加工。在低p H和低离子强度下,高温处理会使WPI水解并自组装形成乳清分离蛋白纤维(Whey protein fibril,WPF)。目前研究主要聚焦于WPF在特定制备条件下的功能特性,而对于纤维化过程中WPF功能特性的变化及其与食品组分的相互作用缺乏系统研究。因此