基于差分隐私的分布式深度学习隐私保护研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:guomenling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习凭借强大的数据分析和处理能力在计算机视觉、自然语言处理等领域得到广泛应用。但是,深度学习模型的训练往往需要大量数据,故难以应用于数据收集受限的场景,例如医院、银行等。分布式深度学习系统中的训练数据存储在用户本地,该系统由多个训练用户和一个参数服务器组成,每个训练用户利用本地数据集训练一个深度学习模型,并通过参数服务器共享模型参数进而提升学习效果。虽然分布式深度学习中的模型训练在用户本地完成,但是共享参数也可能泄露训练用户本地数据的隐私。此外,实际场景中也可能存在需要直接上传原始数据的情况。大多情况下数据通过开放的无线链路进行传输,故攻击者可以攻击开放的无线链路从而获取传输的数据信息或者破坏正常服务进程。本文深入研究了基于差分隐私的分布式深度学习隐私保护,分别提出了对分布式深度学习中共享参数的隐私保护方案以及对上传数据的隐私保护方案。在此基础上,考虑到可能存在针对开放无线链路的恶意攻击,提出了基于生成对抗网络的入侵检测系统,用于检测无线链路中的恶意流量。主要研究工作可分为以下部分:1.针对分布式深度学习中共享参数泄露训练用户隐私的问题,提出了基于差分隐私的参数保护方法。在所提方案中,参与训练的用户通过共享模型权重来提高本地模型学习效果,并且在共享模型权重之前加入满足差分隐私定义的噪声对共享权重进行保护。论文以医疗图像分析领域为实验场景,采用肺炎图像数据集对所提方案可行性进行验证。通过实验仿真发现在分布式深度学习系统中,用户对共享权重进行差分隐私保护后能实现本地深度学习模型精度达到90%。2.针对攻击者可能通过攻击开放的无线链路获取原始数据的问题,提出基于差分隐私的数据保护方案。在所提方案中,原始数据应加入满足差分隐私定义的噪声后再进行发布。论文以智慧城市中的行人检测为实验场景,采用INRIA行人检测数据集对所提方案的可行性进行验证。通过实验仿真发现,深度学习模型对加入噪声的数据识别准确度可达97.3%。3.为了进一步保护无线链路的安全,提出了在服务器上部署入侵检测系统。由于基于人工特征设计的入侵检测系统可能忽视流量数据本身的所包含的信息,在方案中提出将流量数据转换为图片的形式并利用卷积神经网络对图片进行检测。此外,由于流量数据类别数量分布不平衡将带来模型性能下降的问题,在方案中引入生成对抗网络以生成更多的流量数据。论文在UNSW-NB15流量数据集上验证了入侵检测系统对恶意攻击的检测能力。通过实验仿真发现,所提方案可以使得流量分类准确率达到96%。
其他文献
现代社会的急速步伐,令精神障碍相关疾病的发生有增无减,引起大众的关注,全球现时已有超过三至五亿的精神障碍患者,数字继续持续上升,精神障碍(MENTAL DISORDER)将会成为最严
随着社会经济的发展,人类活动不断加剧,对草地资源盲目的开发利用,导致草地退化、沙化等生态环境问题,从而对草地生态系统的稳定性造成威胁,已成为当今世界面临的严峻问题。本研究运用遥感、地理信息系统和景观生态学理论,以福建省9个设区市为研究对象,基于遥感影像数据和实地调查,从景观格局、地形分布、植物群落和生态安全评价等角度研究福建省草地资源的特征及其生态安全状态,利用景观指数和空间自相关探讨草地资源的空
近年来,商业开发逐渐成为历史文化街区活力焕发的主要途径之一,而旅游发展过程中产生的过度商业化现象对历史文化街区的文化氛围和整体风貌产生极大的破坏。商业化的合理发展
目的:分析恶性肿瘤病例感染的危险因素,以提高对该并发症的诊疗的认识。材料与方法:纳入2019年1月~2019年12月之间辽宁中医药大学附属第二医院肿瘤科入院治疗的诊断明确且临床
黄土高原是我国水土流失严重的地区之一,其重力侵蚀又是水土流失的重要策源,尤其是在黄土丘陵沟壑区和塬边区域,土坎、陡坡密集,重力侵蚀严重,侵蚀强度较大。目前防控土坎、陡坡滑塌已成为治理水土流失的重要措施。论文以永寿县、长武县、西峰区的土坎植物群落为研究对象,通过系统的野外样地调查,分析了土坎植物群落的组成结构、群落类型、物种多样性、优势种种间关系以及生态位特征,阐明了不同群落类型物种多样性的差异及对
δ-生育三烯酚(δ-tocotrienol)是维生素E的重要组成成分,然而在关于维生素E的研究中大部分是研究生育酚,尤其是α-生育酚,然而最近研究表明δ-生育三烯酚(δ-tocotrienol)在抗炎
我争取组织入党的过程有11年时间,而争取思想入党的过程似乎至今也没有完成。我是在高中二年级写的入党申请书,那时我充满了革命激情,虔诚地信仰马列主义,严格地要求自己,但
在人工智能蓬勃发展的今天,深度学习被普遍应用于社会生活的各个方面。空气质量的影响因素有很多,比如会受到风向、风速、气温、湿度和污染源排放情况等影响,所以,对空气质量
作为双子叶植物中种类最多的一个科,菊科植物是我国热带、亚热带地区最重要的绿肥资源之一,为了探明我国菊科绿肥的肥用价值,本文分析了39份采于海南、广西、广东、福建、云
“营改增”是一项深化我国财税体制改革的重要决策。营业税的征收由于重复计税,不益于社会和企业的发展,加重了企业的负担。为改变这一现状,实现国家的结构性减税,“营改增”成为我国的必然选择。自国家推广“营改增”以来,“营改增”的研究逐渐成为主流。学者们针对“营改增”政策对建筑业影响的研究成果也逐渐丰富,但关于“营改增”对建筑业税负和业绩的影响的研究结论尚未达成一致。本论文以建筑业上市公司为研究主体,明确