联邦学习环境下的隐私保护机制研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:skyy2483
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“数据孤岛”是限制深度学习等人工智能技术广泛实际部署的关键因素。联邦学习作为一种具有隐私保护特性的分布式学习方式,逐渐引起了人们的关注。然而,目前针对联邦学习的研究处于初级阶段,导致其在实际应用中仍面临诸多挑战。首先,基于神经网络的深度学习模型的准确性不仅依赖于大规模的数据集,训练数据的质量对于模型的性能同样重要。现有的联邦学习方案通常假设参与者已在本地进行了局部数据清洗。然而,在局部数据背景知识下的本地处理会严重影响数据清洗的准确性,进而降低联邦模型的可用性。其次,面向参与者为计算资源充足的企业用户时,现有联邦学习中的安全聚合协议往往要求参与者使用相同的密钥,导致其安全假设过于强烈。过于理想的环境假设严重限制了联邦学习在现实中的应用。最后,面向参与者为计算资源受限的终端用户时,现有的隐私保护联邦学习方案由于其安全聚合开销与参与者数量呈二次关系,导致方案对联邦系统内参与者的数量有着严格的限制。为了全面提升联邦学习模型的可用性,推动联邦学习的实际部署,本论文立足于联邦环境下的隐私需求,从联邦数据的预处理以及联邦学习训练阶段的参数聚合两个阶段,展开以下研究:(1)针对优化联邦数据质量的需求,提出了一种面向联邦系统的高效的分布式隐私保护数据清洗协议。该协议通过混合安全多方计算框架进行基于局部距离离群因子(LDOF)的离群点检测。根据计算函数的特性,采用算数安全计算电路执行数据清洗算法中的算术计算,结合布尔安全计算电路执行排序操作,通过灵活的电路组合,进而实现在任意分割的分布式数据集上,以全局数据为背景知识进行本地数据的高效、精确清洗。最后,提出了一种针对水平分割数据集的优化方法,通过采用局部敏感哈希函数减少参与联合计算的数据量,进一步优化方案的执行效率。相比较与基础方案,优化方案的执行效率提升接近一倍。(2)针对面向企业用户的现有隐私保护联邦学习的安全假设过于强烈的问题,提出了一种支持联合加解密的隐私保护联邦学习方案。该方案基于门限Paillier同态加密,通过结合秘密共享技术构造了密钥分布式生成协议,实现了各个参与者在无可信中心的情况下可以共同生成一个同态密码系统,且各参与者仅掌握该密码系统的主密钥分片。相较于现有使用相同密钥的同态加密联邦学习方案无法抵抗任意参与者与服务器共谋的情况,本文的方案实现了在少于门限数量的参与者与服务器共谋的情况下依然安全。因此,本文的方案在面对真实的环境时更具实用性。最后,通过引入数据编码技术,对明文数据进行打包处理,实现一次加密操作可以处理更多的明文数据,极大地提高了整体方案的效率,进一步提升了方案的实用性。(3)针对面向终端设备的现有隐私保护联邦学习中安全聚合开销过高的问题,提出了一个适用于大规模物联网终端的隐私保护联邦学习方案。该方案通过添加掩码的方式保护原始数据的隐私,并采用秘密共享技术来确保掩码的可消除,进而实现在隐私保护前提下联邦全局模型的准确聚合。相较于现有基于秘密共享的联邦学习方案中参与者需要在每一轮参数聚合时进行关于新掩码的共享操作,本文方案中的参与者仅需在联邦学习初始化阶段进行一次掩码的共享操作。在随后的学习过程中,参与者利用本文提出的安全掩码复用协议,实现在多轮参数聚合的情况下安全可靠地重复使用同一组掩码,并且在整个过程中不需要与其他参与者交互。因此,本文的方案极大地减少参与者的计算开销与通信开销,其可接受的计算和通信开销使得联邦学习可以应用于大规模的终端集群中。此外,针对实际部署中存在部分参与者与云服务器之间的共谋情况,提出了针对性的解决方案。最终,通过在真实的物联网终端设备(智能手机和树莓派Raspberry Pi)上进行了全面的测试实验,评估了方案的实用性。大量的实验结果验证了提出的方案在计算和通信开销方面的优越性,同时保持了模型的准确性和数据的机密性。
其他文献
多晶硅光伏电池和组件表面色差及其光吸收特性研究是当前新能源领域光伏电池表面光学结构研究方向的前沿研究课题之一,其成果有助于提高太阳能的吸收利用,在光伏产业具有广阔的应用前景和重大的应用价值,因而引起人们的高度重视。本文通过理论分析、模拟计算与实验测试等手段对光伏电池表面光学结构的色差和光吸收特性深入系统地开展研究:根据各波段吸收能量叠加的原理,利用传输矩阵法模拟仿真了不同太阳光谱辐照度分布下光伏电
学位
合成生物学是21世纪新兴的交叉学科,已经为医药、化工、能源、食品和农业等领域带来了显著的改变。微生物细胞工厂(microbial cell factories,MCFs)的构建和应用是合成生物学的重要研究内容,正迅速向实用化、产业化的方向发展。得益于基因编辑技术的进步,MCFs菌株文库构建的能力大幅提升,亦产生了数量庞大的待测样本,亟需发展高通量自动化的分析检测方法与之匹配。此外,针对关键代谢酶或
期刊
使用金属导线传输电能是目前常用的供电方式,技术已十分成熟,但在易燃易爆、强磁场、强电磁干扰或为远距离低电压用户供电(传输距离达数十公里甚至上百公里,用户工作电压仅为几伏的直流电,且对电力需求量十分有限)等特殊情况下不宜使用。激光能量光纤传输(Po F,power over fiber)技术是将电能转化为光能,经过光纤传输至用户终端处,再将光能转化为电能的技术。该技术利用光纤传输能量,不会产生电火花
学位
随着科技的发展,人们对信息处理和计算速度的要求越来越高,这使得集成化、小型化的光学元件成为发展趋势。然而,基于自然材料和超构材料的光学元件存在尺度大,效率低等问题。近年来,由人工微结构单元构成的超构表面通过设计入射光与结构单元之间的局部相互作用能够对出射光束进行精确调控,并以亚波长分辨率自由设计光学波前,为实现光学元件的集成化和小型化提供了无与伦比的平台。其中,超构透镜作为超构表面领域重要的研究方
学位
全切片成像(Whole slide imaging,WSI)是一种典型的大视场(Field of view,FOV)、高分辨率成像方式。其利用高倍高数值孔径(Numerical aperture,NA)物镜或超分辨率重构算法采集高分辨率图像,通过扫描或非扫描的方式获取目标的大视场,最终形成一整张数字的、高清晰的、无缝的以及全切片的目标图像。数字病理是下一代癌症诊断与分析的基石,而WSI是实现数字病
学位
钢板剪力墙因其具有自重轻、抗震性能好、装配率更高等诸多优势,得到了广泛的应用和发展。目前专家学者对有关钢板墙结构消能减震技术进行了大量的研究,本文从钢板墙结构形式和附加消能减震设置两方面针对钢板墙结构消能减震技术进行综述,通过对相关文献的综合分析,总结了目前该领域的研究现状。
会议
临近空间高速目标等离子体电磁科学实验装置的目的是为了在等离子体射流的条件下进行相关电磁实验。等离子体射流的电子密度分布是电磁实验的一个重要参数。本装置产生的等离子体射流具有高焓值高电子密度的特点。通过计算和实验测量的方法获得等离子体射流能量特性和电子密度分布是本文重点研究的内容。高焓值等离子体射流中有大量的化学反应,化学反应带来各组分的变化,各组分的变化影响输运及热动力参数,输运及热动力参数会影响
学位
超薄、超轻、高分辨率光学望远镜的研制对天文观测和空间监视光学望远成像的发展具有至关重要的意义。近年来,基于微纳光子集成电路(Photonics Integrated Circuits,PICs)的微缩干涉集成光学成像技术的发展为研制超薄平面型超高分辨率望远镜系统提供了新途径。微缩干涉集成光学成像本质上是一种基于PICs的光学综合孔径干涉计算成像技术,完全区别于基于折反射原理工作的光电望远镜成像系统
学位
飞行器在临近空间内以高超声速飞行时,会产生一层等离子鞘套。当导航、遥控遥测、安控等信号穿过这层等离子鞘套时,会产生严重的衰减,即出现所谓的通信“黑障”。信号的衰减幅度主要决定于等离子鞘套的密度,通过降低等离子鞘套密度便能够使信号的衰减得到较大的改善。电磁调控作为一种降低等离子鞘套密度的有效手段,在国内外已经进行了长时间的研究。目前主要集中在正交电/磁场调控、行波磁场调控和脉冲磁场调控这几个方向。但
学位
为了提高多激光选区熔化技术在拼接区域的成形质量,研究了不同拼接顺序对双激光选区熔化成形TC4钛合金拼接区域的表面形貌、内部缺陷、拉伸性能等成形性的影响。结果表明,相邻层间条带无相对偏转时,双激光逆序拼接因激光熔化扫描过程中粉末的剥蚀效应导致拼接区域表面起伏较大,且易于产生内部缺陷;双激光顺序拼接可大幅消除拼接区域表面起伏,且内部缺陷大幅减少;设置67°相邻层间条带相对偏转角时,双激光顺序拼接试样可
期刊