联邦学习下差分隐私保护技术研究与实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:up2hyolee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
差分隐私技术通过噪声机制和指数机制分别对数值型数据和非数值型数据进行保护,其以严格的数学证明和定量分析来有效保护隐私数据,传统上在中心化数据上进行差分隐私保护保护,但是如今面临分布式数据的情况,需要在联邦学习的环境下进行隐私保护。联邦学习旨在建立一个分布数据集的联邦学习模型,其设计之初面对的是跨领域、跨部门、跨行业的敏感数据集无法中心化的问题,因此需要在本地进行相应的处理,然后协同构建学习模型。本文针对联邦学习环境下,多方协同构建模型中面对隐私问题进行研究,主要做了以下三个方面的工作:(1)面对联邦学习下在使用XGBoost(eXtreme Gradient Boosting,极端梯度提升树)进行数据分析时,针对弱分类器构建过程中会出现的隐私泄露问题,提出了基于XGBoost的差分隐私保护算法。该算法先对弱分类器中的节点进行了最佳分割点的切分,采用指数机制进行差分隐私保护,然后,在叶子节点上通过拉普拉斯机制进行扰动以保护分类结果。从而在构建模型过程中,既能进行隐私安全保护,又能达到数据不错的效果。实验结果表明,在基于XGBoost的差分隐私保护下,相比传统的随机森林差分隐私保护,在兼顾隐私保护的前提下具备更好的准确率。(2)针对联邦学习环境下需要多方参与者共同构建符合隐私保护的模型问题,提出了基于联邦学习下满足差分隐私的多方协同构建方案,解决了在多方参与者的情况下基于联邦学习环境部署和架构XGBoost算法的问题,并且在部署的过程中进行了隐私保护。该模型在面向多方参与者只拥有自己的数据集的情况下,通过聚合服务器传递自身的分裂点与其他参与者进行协商,决策出最适合的分裂点,最终协同构建出模型。实验表明,该模型在保证了准确率的前提下,具备运行时间短、效率高的特性。(3)设计并实现了联邦学习下差分隐私保护技术的原型系统。针对联邦学习环境下的差分隐私算法模块进行了实现,结合某医院的医疗数据集在该原型系统下进行了实验,实验表明了该原型系统既能保证数据安全,也能具备较高的分类准确率。
其他文献
随着天文观测技术的不断发展,越来越多的天文光谱数据被望远镜收集,用于天文研究。光谱中蕴含着一个天体的许多信息,有助于天文学家研究天体形成以及宇宙起源,因此,天文光谱分析有着巨大的意义和价值。然而,面对目前海量的高维天文光谱数据,传统的人工分类方法在效率和准确率上都存在不足。本文的研究重点在于高维天文光谱数据的特征提取与智能分类,具体包含四个方面:天文光谱的预处理方法研究。首先分析了天文光谱数据的物
随着物联网(Io T)的发展和商业Wi Fi的普及,行为感知技术已广泛应用于生产和生活的各个领域。由于Wi Fi设备具有分布广泛,成本低廉,容易部署等特点,过去的十年中,研究人员已开始将商业Wi Fi用于人类行为感知。虽然众多工作已经证明Wi Fi作为感知技术拥有巨大潜力,但目前存在一个明显的缺点,Wi Fi行为识别系统在跨场景识别中表现并不佳。即将一个场景训练完成的Wi Fi行为识别模型直接拿到
随着“物联网”概念的提出和室内无线接入设备的广泛部署,基于Wi Fi的环境感知技术可以通过现有的无线设备实现对周围环境的感知,同时在人员动作检测、医疗监护、室内定位等多个领域都具有十分重要的研究意义。该技术主要是依据环境中物体的移动对信号传输链路产生影响,收集无线信道的两大特征:接收信号强度指示(Received Signal Strength Indicator,RSSI)或信道状态信息(Cha
近些年来,柔性可拉伸电子设备因其具有体积小、易便携、灵活性好、可拉伸和弯曲等特性而广泛地应用于医疗监护设备、智能可穿戴设备等领域。因此,作为柔性可拉伸电子设备的重要组成部分,柔性可拉伸天线成为新的研究热点。柔性可拉伸天线既要实现拉伸、弯曲等形变,还要在形变后仍然保持正常的工作性能。针对这一需求,本文基于剪纸艺术(Kirigami)结构设计了四款柔性可拉伸天线。Kirigami结构可以使普通的金属面
频率选择表面(Frequency Selective Surface,FSS),是由若干单元按照周期或准周期排布构成的阵列结构,对不同工作频率、极化状态和入射角度的空间电磁波具有选择与调控功能。凭借灵活的电磁波调控能力和独特的物理特性,FSS已经被广泛应用于设计微波和太赫兹器件和天线。其中,由FSS构建而成的透射阵天线,在实现定向辐射以及波束控制、扫描和赋形等方面表现优异,对于降低天线系统复杂度、
近年来移动群智感知技术的巨大潜力吸引了产业界和研究界的广泛关注,这得益于迅速普及的嵌入式传感器设备。移动群智感知通常一个由基于云的平台,部分数据需求者以及若干参与者(通常为手机用户)三部分组成。数据需求者通过云平台发布数据需求任务,用户可以通过手机内置的传感器来执行感知任务并上传相应数据。一般情况下,用户需要移动到特定的位置才能执行对应的感知任务,用户在执行对应的任务时会消耗一部分自己的资源,例如
边缘设备的一个重要特点是产生的数据规模巨大,同时边缘设备的通信能力、运算能力有限,因此在边缘计算中为了提高传输效率一般采用数据聚合的方法。但是由于边缘设备所处环境恶劣,更容易遭到恶意攻击,例如虚假数据注入(Fake Data Injection,FDI)攻击,FDI攻击会恶意篡改数据,造成通信资源的浪费,影响聚合结果的精确性,从而导致控制中心做出错误的决策。因此保证边缘场景中数据的私密性以及聚合的
随着网络技术的发展和Wi-Fi基础设施的广泛普及,移动智能设备和无线网络已经渗透到人类生产生活的各个方面,基于位置的服务(Location Based Service,LBS)逐渐成为人们生活中不可或缺的部分。定位是各种位置服务的最重要部分。随着城市化的发展,现代人的生活环境逐渐从室外转移到室内。尽管目前基于卫星的室外定位和导航技术已经较为成熟,并且得到了广泛应用。然而,卫星信号无法穿透钢筋水泥等
岩画是一种现象,是包含着文化的一种现象,其内容表达形式是复杂的。岩画产生的时代要早于文字所产生的时代,是早期人类对于世界认识的重要依据,是古人记录文化生活的一种方式,是一种形式性史书,具有延续性。中国是记录岩画最早的国家之一,在以往的史书中对岩画均有提及,战国时期的《韩非子》北魏时期的《水经注》以及后世陈兆复的《中国古岩画》。从这些史料文献中可以看出岩画是受地域、民族、信仰宗教、政治背景所影响的。
随着各种移动和物联网设备的出现,利用机器学习和增强现实技术的新型服务和移动应用程序正在涌现。这些服务通常都需要更多的云上计算资源、更低的延迟和更高的可靠性,因此边缘计算技术应运而生。目前,边缘计算技术在诸多场景下都得到了应用。多接入边缘计算(MEC)技术将边缘计算的应用从原来的移动蜂窝网络推广向非3GPP(如Wi-Fi和固网)这类的无线接入方式,进一步促进了边缘计算技术的普及和实施。尽管MEC技术