机器学习中的训练样本隐私保护技术研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:ahaqwjtyl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着理论的不断发展和成熟,机器学习技术正在广泛地应用到各行各业中。机器学习算法从训练数据中学习挖掘统计知识,并对未知的事物进行预测,来辅助人类进行决策。充足的数据是机器学习并不可少的条件。因此,为了机器学习模型能获得更好的性能,海量的数据正在被收集和利用。在一些特定的应用场景,如医疗、个性推荐等,用户的数据难免会涉及到不便公开的个人隐私。在收集和利用这些数据时,应综合考量用户数据的可用性和隐私问题。为保护数据的隐私,本文基于粒子群算法提出了一种通过原数据集生成新数据集,用新数据集训练模型,使得模型不直接接触原数据集的方案。本文深入研究了可以判断一条记录是否在模型训练样本中的成员推理攻击,基于其算法原理和在不同公共数据集上的攻击效果分析了攻击的弱点和对不同分布的数据的敏感程度,并总结了对攻击抵御能力较强的数据和模型的特点。在上述分析结果的指导下,本文提出了从原始数据集生成新数据集的粒子群样本迁移法。粒子群样本迁移法充分考虑了上述分析结果中攻击的弱点和数据的可用性,使得生成的新数据集不易被攻击且模型精度损失可控。此外,本文还在训练模型时对优化迭代的梯度添加噪声,使得模型的训练过程满足差分隐私。本文在MNIST数据集上对上述的方法进行了综合实验。实验结果表明,提出方案在模型精度损失较小的情况下很好地抵御了成员推理攻击。且粒子群样本迁移法相较与添加随机噪声的方法有更好的保护效果和更小的模型精度损失。基于上述提出的算法,本文设计并实现了保护样本隐私的机器学习模型训练系统,对其主要功能模块和流程进行了详细的介绍,并用实验证明了其可用性。结果显示,本系统在可控的精度损失下很好地保护了训练数据的隐私。
其他文献
目的:探究内源性TIGAR在心肌缺血再灌注损伤中的作用,以及外源性给予一定浓度的NADPH是否具有心肌保护作用和可能机制的研究。方法:第一部分 利用雄性SD大鼠建立在体原位开胸
物联网技术的发展使得物联网智能设备无缝融入人们的生活,涉及家庭、教育、物流、安保等多个行业领域。物联网智能设备通过无线通信技术互联,具备数据共享和信息处理能力。利用设备上的传感器芯片,智能设备具备感知能力可以感知周围的物理环境,以支持更强大更智能的服务。而由于无线通信的开放性特点,智能设备之间的数据交互容易遭受到窃听、篡改和中间人攻击。而传统的建立安全信道的方法如公钥基础设施不适用于动态、移动性强
根据实际工程需要,设计了新型的电动双侧犁式卸料器,采用带外行程可调电动推杆以及低摩擦材料,其结构合理、可靠性高,实用性强,是连续输送中理想的卸料装置。
目的:以光交联明胶水凝胶(GelMA)为基础材料再在3D打印的模具中逐次成胶构筑仿生骨骼系统骨膜、骨质、骨髓层次结构的支架,并研究其促进长骨干处大段骨处骨膜、骨质、骨髓结构的修复。方法:首先通过改良的模板法合成介孔生物活性玻璃微球(MBGNs),而后使用氨基丙基三乙氧基甲硅烷(APTEs)处理微球制备氨基化的生物活性玻璃(MBGNs-NH2),再通过碳二亚胺法于微球表面接枝GelMA单体分子得到G
木质纤维素是构成烟草细胞壁的主要物质,它们对卷烟制品的评吸品质及安全有不同程度的影响。烟叶中纤维素具有促燃性,但过多会使烟叶组织粗糙,吸湿性大,不容易储藏,同时增加烟气的刺激性。而降解纤维素前提是先处理烟草中结构坚固且致密的木质素,两者相互缠绕且彼此不分离。烟草制品中木质素含量过高也会引起涩口和产生促癌活性。烟叶中烟梗因高木质素含量一般都会被弃置,造成烟梗资源浪费。通过在烟草薄片制造过程中对烟叶纤
淡水蚌类在世界各地都有分布,是淡水生态系统底栖生物群落中重要组的成部分,具有重要的生态功能。中国淡水蚌类物种丰富,但是近年来由于人为活动干扰导致的栖息地破坏,蚌类资源严重衰退,许多物种处于濒危状态。传统上,蚌科鉴定和分类主要依据贝壳的形态特征,但由于许多近缘种贝壳的形态特征具有高度可塑性和趋同现象,使得淡水蚌类的分类较为困难,同时关于中国蚌科属上阶元的分类也存在不同的观点。解决这些问题能为中国淡水
Liguzinediol是对吡嗪类生物碱单体川芎嗉的侧链对位甲基进行羟基化结构改造和修饰的产物,化学名为2,5-二羟甲基-3,6-二甲基吡嗪。前期药理研究表明,liguzinediol作用于治疗
如今,中职教育以往教学模式早已无法有效提升学生的动手能力,但通过校企合作这种形式可以对这一问题加以解决。然而,不少中职院校当中的市场营销这一专业开展校企合作期间都
中国共产党第十八次全国代表大会通过的报告中,五位一体之一的文化建设提及:“增强文化软实力,让文化产业成为国民经济支柱性产业。”在这一总布局的号召下,我国文化体制改革
近年来,并购成为上市公司发展转型的重要手段之一,并购活动在资本市场上发展迅猛。并购商誉作为企业的一项资产随之增加,特别是采取高溢价并购的信息技术行业上市公司其高额商誉的存在比较突出,随着这些并购公司的并购标业绩对赌不达标,商誉减值甚至是巨额商誉减值成为资本市场和社会关注的热点问题。2018年商誉减值暴雷事件不断发生,无疑给我国资本市场带来了巨大影响。研究造成巨额商誉减值的原因及经济后果具有重要的现
学位