基于非独立同分布数据下的联邦学习方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:areschicken
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着物联网技术的飞速发展,用户设备可在本地生成大量数据,并利用这些数据使用人工智能技术提取有用信息,进而实现检测、分类和未来事件预测等。然而,考虑到有限的网络带宽和隐私问题,这些数据通常都无法直接上传至远程的服务器来处理。移动边缘计算的出现使得在网络边缘也可以实现本地数据的存储和处理,这是因为边缘节点,如移动设备、网关等通常都具备存储和计算能力。此外,机器学习技术可用来从物联网设备存储的数据中提取有用的信息,但是直接获取用户数据常常面临着用户的数据隐私和安全问题。基于上述背景,一种新式的分布式机器学习算法,联邦学习,应运而生。联邦学习能够让多方协作训练模型的同时,避免数据的收集和共享,非常适合处理物联网设备中的本地数据。然而,尽管联邦学习能够使用户设备协作训练全局模型而无需向服务器共享他们的隐私敏感数据,它仍然面临着一个重要的挑战,即联邦学习的训练数据往往是非独立同分布的,而这会使模型在训练过程中受到偏扰,进而导致模型的精度下降。为了减轻用户设备中非独立同分布数据导致的模型精度损失,本文提出了一种基于设备选择的联邦平均算法。首先,本文定义了用户设备间的权值差异,并通过实验验证了用户设备数据的非独立同分布程度越高,其权值差异越大,进而可识别出数据分布较均匀的用户设备。然后根据上述结论,本文设计了一种基于权值差异的用户选择机制以及联邦平均算法,使得数据非独立同分布程度较低的用户设备可以更频繁地参与训练。与传统的联邦学习算法相比,该方法利用了数据均匀分布的用户设备来缓解非独立同分布数据造成的负面影响。为了验证CSFed Avg的有效性,本文在公开数据集CIFAR-10以及Fashion MNIST上进行了实验。结果表明,相较于以往方法,CSFed Avg在减轻非独立同分布数据的影响并提高模型的准确度方面,均取得了最优的效果。
其他文献
脑-机接口系统可以直接在大脑和外部设备之间建立连接通路,并通过解码脑电信号得到一系列可执行的机器指令,使大脑能够实现对外部设备的操控。基于运动想象的脑-机接口系统是一类典型的自发式脑-机接口。由于其不需要借助外界装置的刺激,受试者通过运动想象即可产生脑电信号,因此受到了广泛的关注。目前,因为脑电信号采集困难,脑-机接口系统存在训练数据量较少的问题。然而,脑电信号具有个体差异大的特点,具体表现为不同
肠道菌群在宿主的营养代谢、神经调节和免疫保护中扮演着极其重要的角色,且菌群的组成与膳食结构中可供微生物利用的碳水化合物比例高度相关。抗性淀粉球晶(resistant starch spherulites,RSS)因具有较好的热稳定性和加工稳定性,同时表现出优良的产丁酸特性,并促进有益菌的增殖,有利于促进肠道健康、降低代谢疾病的风险,在碳水化合物营养领域受到了广泛关注。近年研究表明,抗性淀粉的结构差
自2013年以来,我国环境空气质量持续改善,但以臭氧和细颗粒物为特征的区域复合型大气污染形势依然严峻。挥发性有机化合物(Volatile Organic Compounds,VOCs)作为PM2.5和O3的重要前体物,严重影响大气环境质量以及人民身体健康。催化氧化技术具有降解效率高、二次污染少等优点,被认为是最有效和经济可行的技术之一,设计与合成低温高效的催化剂是提升催化氧化技术效能的研究重点。本
基于深度学习的人脸识别方法研究主要围绕人脸数据集、深度神经网络和损失函数等角度展开,通过人脸图像质量评估挑选出高质量图像,有助于提升识别系统的效率和性能。经过学者们多年来的潜心研究,人脸识别技术得到了飞速发展。本文在总结和借鉴前人研究成果的基础上,针对人脸数据集、损失函数、人脸图像质量评估三个方面的不足进行了一定的改进和创新,具体的工作内容如下:1.针对人脸数据集构建过程繁琐及种族不平衡的问题,本
淀粉和蛋白质是食品的主要组成成分。食品体系中淀粉分子与蛋白质分子的相互作用机制直接决定了食品的质构、加工、储藏等性能。但是由于蛋白质大分子本身较复杂的多级结构,直接研究其与淀粉分子的相互作用机制显得尤其困难。小分子氨基酸作为蛋白质的基本组成单元,研究氨基酸与淀粉的相互作用机制能为蛋白质分子和淀粉分子的相互作用关系提供基础理论指导。此外,作为添加剂及营养强化剂,氨基酸已被广泛应用于淀粉类食品体系。探
对于消费者来说,空间感知能力不断提高,购物中心的空间设计也需要不断创新,注入新的设计思维。室外游憩空间是购物中心吸引客流的重要场所,然而购物中心室外游憩空间面临着缺少互动性、娱乐性、体验性,同时吸引消费者停留的时间也逐渐缩短的问题。本文以此为研究背景,以株洲市购物中心为研究对象,结合本人工作实践现实问题,针对影响购物中心使用的休憩空间这一关键要素展开研究。本文采用使用后评估的方法对其进行研究,通过
水下图像常出现色彩畸变、对比度降低以及能见度下降等现象,影响了水下机器人、水下光缆检查和水下生态系统监控等相关计算机视觉系统的应用。现有的水下图像复原方法存在参数估计难、水下训练数据需求大的问题。针对上述问题,本文结合Retinex理论和深度学习理论,面向复杂水下场景,研究和设计水下图像复原方法。(1)构造了水下衰减模型。使用Retinex方法从水下图像分离出反射率图,设计并训练多尺度特征融合网络
锂离子电池自问世以来虽然取得了巨大进步,但未来要满足大型储能设备及电动汽车等电子产品的应用需求,仍面临着一些技术上的挑战。与普通消费电子产品相比,电动汽车的应用对电池的能量密度、功率密度、循环寿命、安全性等性能指标具有更高的要求。使用高容量锂离子电池负极材料是提高能量密度的有效途径之一,石墨负极目前在商业化锂离子电池负极材料中仍占据主导地位,但其理论比容量较低,无法满足未来对发展高能量密度电池的需
当今国际形势复杂多变,提高国防军事实力迫在眉睫;由电磁技术带来的环境问题也日益凸显。因此吸波材料这类能有效减少电磁波危害的特殊材料受到各国重视,研制出能适应当今社会发展要求的高性能吸波材料具有重大意义。钴铁氧体(CoFe2O4)是常见的一种吸波材料,其价格低廉,工艺成熟,但是具有密度大,电阻率高等缺点。本文针对其缺点,综合考虑空心玻璃微珠(HGMs)、碳微球(CMs)和铁-钴合金(Fe-Co)的电
随着现代会展业的发展,国内会展建筑持续建设,范围覆盖至我国二、三线及以下城市,并以中型规模场馆为主流。然而,全国大量展览资源向展览经济发达区域的顶级场馆倾斜,头部效应显著,我国南方非展览发达区域的中型会展建筑普遍存在使用效率低下的现状问题,并普遍寻求空间的弹性经营与使用。因此,有必要对会展建筑常见的弹性使用方式进行深入研究,归纳不同维度的使用弹性需求与相应设计特征,为南方中型会展建筑在激烈市场竞争