基于联邦学习的不平衡数据集下模型优化方法研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:qiukaifeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的高速发展和移动设备的普及,各种基于深度学习的应用进入我们的生活,深度学习的成功离不开神经网络对数据的高表征能力,离不开庞大且丰富的数据集。其中,分布式数据处理和分布式机器学习的作用日益凸显,需要多个参与方协作的需求不断涌现。然而,在实际场景中,很多数据由于隐私安全和保密政策,数据拥有者不愿意或不允许将数据分享出来。并且,将数据聚合到一起训练模型会产生高昂的通信成本和存储成本。由此,联邦学习应运而生。联邦学习是一种分布式机器学习技术,能够在保证数据保留在本地不予共享的前提下,使多方设备或机构利用本地数据集协作构建一个共享模型。联邦学习在移动设备的应用场景下很有发展前景,人们每天产生大量的数据保存在私人设备中,在保证数据隐私安全的前提下,这些真实且庞大的数据能够帮助联邦学习构建出更加复杂且准确的模型,为用户提供个性化服务。然而,不同于标准数据集,这些分散在真实设备上的数据集的数据分布是不平衡的,这种不平衡包括全局不平衡(类不平衡)和局部不平衡(独立非同分布),这种特性会导致最终训练出来的模型准确率大幅下降。此外,联邦学习通常采用一个预定义的神经网络结构做为初始模型,这种预定义的模型结构对数据分布不平衡场景下的联邦训练来说不一定是最优的,且由于联邦学习模型训练周期长,研究人员手动调整网络结构到最优是非常低效的。本文针对上述问题,对联邦学习中不平衡数据集下的模型进行优化,主要包括以下几个方面:·本文首先通过实验和数学推导,探究了不平衡数据集对神经网络模型的具体影响及原因,得出不平衡的数据集会导致模型准确率大幅度下降;训练集和验证集数据分布的异构性是导致模型准确率下降的直接原因;在神经网络结构确定时,仅通过模型训练无法达到平衡数据集下的最优权重。·针对局部不平衡数据集,本文提出了一种基于Kullback-Leibler(KL)散度的模型分组训练调度优化方法。根据客户端数据集的平衡度,设计了基于贪心策略的分组方法,形成局部平衡的数据集,并分配中间服务器管理组内训练。通过实验探究了数据分布对模型收敛效率的影响,得出模型从平衡度由高到低的顺序进行训练时收敛效率最高,由此设计了基于KL散度的模型训练调度优化方法。·针对全局不平衡数据集,本文设计了基于神经网络结构搜索的联邦学习架构。该架构采用基于分组的搜索策略,由算力强大且存储资源充足的中间服务器与客户端配合进行神经网络结构的搜索,能够使得资源受限的移动设备也参与到神经网络结构搜索中。最后实验验证了本文方法较不平衡的CIFAR-10数据集上Dense Net的准确率平均提升了4.39%。
其他文献
随着经济的日益发展,无人驾驶在汽车驾驶中的地位越发重要,在无人驾驶中车辆进行各种驾驶决策的关键一环是道路检测。然而现有的应用于道路检测的多模态数据融合方法由于未能降低LiDAR点云数据之间的距离,导致在道路检测中会出现检测过程时间开销大的问题。本文通过将LiDAR点云数据和视觉图像数据两种异源数据通过球面坐标变换进行数据级融合,并使用改进的SegNet进行道路检测,以此实现一种高精度低时延的道路检
学位
厌氧膜生物反应器(anaerobic membrane reactor,AnMBR)作为一种应用广泛的有机固体废物处理工艺,利用有机物产生沼气的同时实现剩余污泥的减量化,在技术和经济上具有很大的优势和前景。目前,AnMBR在实际应用中面临诸多技术难题,如厌氧消化性能低、消化残渣处理难、膜污染严重等。共消化是一种简单高效处理有机固体废物的技术,在提升厌氧消化性能、缓解膜污染等方面有极大的应用潜力。基
图像配准和图像分割是医学图像处理中的两项关键技术,在疾病诊断、手术导航、疗效评估等实际医疗场景中发挥着非常重要的作用。传统的医学图像配准和人工分割耗时较长,且对医生的专业水平要求较高。随着医学图像种类和数量的激增,医生的工作负担显著增加,从而导致漏诊和误诊的现象发生。近些年来深度学习的快速发展,吸引了越来越多的研究人员将深度学习引入医学图像配准和分割任务中,利用计算机来辅助医生进行诊断,提高医生的
蓝藻水华一直是全球性重大环境问题,对蓝藻进行环境友好的处理与处置是关系国计民生的重要研究课题。蓝藻富含蛋白质、碳水化合物、脂类等营养物质,蓝藻的高值化再生资源回收利用成为近年来的研究热点。通过厌氧发酵对蓝藻进行资源化利用具备广阔应用前景和实践意义。但蓝藻细胞独特的刚性结构导致厌氧发酵效率不高,为强化蓝藻厌氧发酵效率,需针对蓝藻实行一定的预处理。目前已公开的蓝藻厌氧发酵预处理方法不多,因此,亟需开发
学位
随着半导体技术的迅猛发展,突破物理尺寸的限制变得越来越困难,纳米线环栅已成为5nm以下技术节点的核心器件结构。而可重构场效应晶体管器件(RFET)得益于其自身的结构特点,通过极性栅(Program gate,PG)调控流经沟道内载流子的类型,在一个晶体管内可实现N型导电与P型导电的动态可重构,拓宽了传统晶体管的功能。这样通过RFET的可重构特性,从而可以达到使用较少数目的晶体管去实现更加丰富的逻辑
网络管理机制的核心就是对网络设备进行监控然后根据监控结果发送操作指令。传统的分布式网络管理采用SNMP、Netflow等网络管理方式,在应对不断增长的网络规模下已逐渐不满足要求。例如在数据中心网络中,传统的网络管理方式无法适配数据中心网络大规模、低时延、不可预期等特征。在软件定义网络(SDN)架构下,转控分离和数据面可编程的出现,使得有能力实现低时延监测的带内网络遥测(INT)发挥出了优势。所以,
混成系统是同时包含连续状态和离散状态的动态系统。连续部分通常模拟物理环境的相互作用,而离散部分通常模拟控制系统的运行。计算和控制的结合会导致非常复杂的系统设计,因此混成系统常被应用于航空航天、汽车工业和工厂自动化设计中。到目前为止,混成系统中使用了多种形式化建模方法:混合自动机、混合Petri网、Modelica、Zelus等。对于混合系统的形式化验证,可以使用多种工具,如Hy Tech、PHAV
自股市诞生之后,股票预测问题就受到了来自金融领域和计算机领域的众多研究者的关注。随着深度学习的发展,历史股价、新闻、论坛等数据被各种各样的深度学习模型运用于股票预测问题。然而,其仍然面临着诸多难题,例如财经新闻数据大、涉及面广,当财经新闻中未直接出现上市公司名称时,难以预测受该新闻影响的上市公司,即财经新闻的相关公司挖掘问题;上市公司之间存在复杂多样的关系,公司间相关性建模困难等问题。针对上述挑战