深度学习数据安全及隐私保护关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:puppy_tang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习作为人工智能的代表性技术,在大数据时代成为了海量高维复杂数据分析处理的重要手段,特别是多层感知机、卷积神经网络和生成对抗网络等深度学习模型。近年来,深度学习在自然语言处理、图像分类、智能推荐、语音识别和恶意软件检测等方面表现出了优异的性能,所以越来越广泛地应用于自动驾驶、计算机视觉、智能家居、电子商务和信息安全等领域。但是层出不穷的深度学习安全问题给其研究者和使用者敲响了警钟。其中最突出的安全问题是深度学习系统中重要的数据资产往往会受到攻击者的觊觎,因此需要保护其安全。这些数据资产主要包括训练数据集、训练好的模型和模型预测的输入输出。由于深度学习本身具有一些内在弱点,使得攻击者有机可乘,开发了下毒攻击、模型反转攻击、模型提取攻击和对抗性攻击等攻击工具。因而深度学习系统是存在安全漏洞的,这在一定程度上阻碍了其广泛应用和推广到关键领域,例如军事领域。而且现存的深度学习数据安全与隐私保护技术还不能让人满意,不能让深度学习系统的使用者放心。本论文针对上述问题,以保护深度学习系统的重要数据资产为研究目标,重点关注深度学习训练数据收集、模型训练和模型预测三个关键阶段面临的安全问题,以密码学、数据安全及隐私保护技术为理论基础,从保护数据拥有者隐私、联邦学习参与方数据安全、输入输出安全和模型安全等角度展开研究,提出了相应的灵活高效的深度学习数据安全及隐私保护解决方案。总结本论文的主要研究成果和贡献如下:1.针对深度学习训练数据收集过程中存在带标签高质量数据缺乏、数据拥有者担心其数据隐私泄露的问题,提出了一种保护数据拥有者隐私的深度学习训练数据生成技术。该技术方案以条件生成对抗网络作为生成数据的主体,满足了生成大量带标签训练数据的需求;结合数据变形方法实现数据隐私保护,解决了数据隐私泄露的问题。此外,为了补偿数据变形带来的数据可用性损失,设计了一种卷积层增强方法。因此,该方案既能保护数据隐私,又能保持数据可用性,同时还能生成大量带标签训练数据,不受限于数据拥有者的原始数据集大小。详细的安全性分析表明所提出的方案可以保证数据机密性。根据实验仿真结果,数据变形和卷积层增强所引入的大部分操作,均由数据拥有者来完成以保护数据隐私,但是计算效率较高。通过与其他数据生成方案的对比,该方案在数据可用性和保护数据隐私等方面均具有优势,能满足深度学习训练数据收集阶段对训练数据的安全要求和实用性需求。2.针对深度学习训练数据收集过程中存在数据可用性验证困难、数据提供者积极性不高、数据隐私可能泄漏和数据交易公平性欠缺等问题,提出了一种基于区块链、差分隐私和环签名的带激励机制安全公平的深度学习训练数据收集技术。该技术方案允许数据拥有者有偿地提供其数据,即凭提供数据获得的积分享受深度学习预测服务,因此该方案可视为数据交易方案;此外,为了保护数据拥有者的隐私,在提供数据前,数据拥有者对其敏感数据加入可控的拉普拉斯噪声进行差分隐私处理;而为了实现可持续发展,该技术方案还特别关注数据交易的公平性,即数据拥有者提供的数据质量受到评价监督,数据消费者对数据的购买使用记录和提供深度学习服务以补偿数据拥有者的行为也可跟踪。形式化的安全证明和全面的方案功能对比证明了提出的方案是安全实用的。3.针对深度学习模型训练过程中存在的联邦学习参与方数据隐私可能泄漏、需要单独安全信道与参数服务器通信的问题,提出了一种在某联邦学习参与方与参数服务器合谋的情况下也能保护其他参与方数据安全的深度联邦学习模型训练技术。该技术方案引进了一个密钥转换服务器,并在深度模型训练中的异步随机梯度下降过程使用了同态重加密。安全性分析和实验仿真表明该方案虽然比原来的联邦学习方案增加了一定的通信开销,但获得了更多的安全性能,而且各个联邦学习参与方计算开销都是相似的。总的来说,该方案是一个更安全更准确的适用于分布式深度学习的联邦学习模型训练方案。4.针对深度学习模型预测过程中存在的输入数据、输出结果及模型参数可能泄漏、工作者可能被诬陷等问题,提出了一种输入输出数据和模型均安全且公平的深度学习模型预测技术。该技术方案首先基于安全三方计算构建了具有三个工作者的深度学习模型预测服务系统。然后提出为输入数据、模型参数、中间计算结果和最终输出结果生成对应的承诺证书的方法以实现公平性,即作弊的工作者会被检测出来且不可抵赖,诚实的工作者不会被诬陷,因为其行为的诚实性是公开可验证的。因此该方案既保护了用户的输入数据和预测结果隐私,又保护了服务器预训练模型的安全,同时方案对于其参与者来说是公平的。总之,该方案是一个更安全更公平的适用于提供深度学习模型预测服务的方案。
其他文献
旱灾是一种在世界范围内普遍存在的气象自然灾害,其对农业生产和人类社会造成了巨大的危害。旱灾的形成受自然环境和人类社会环境双重影响,其影响因素众多且因素之间关联复杂,目前对其形成机理尚缺乏较为清晰的认识。因此,关于农业旱灾形成机理及旱灾灾情预测和评估等问题一直是研究的热点。本文基于系统科学观点,提出以区域农旱灾系统为研究对象,利用灰色系统理论与方法,通过分析其系统结构,构成要素、要素之间的运行行为和
具有高功率、窄线宽、高能量激光输出的高性能单频光纤主振荡功率放大器(MOPA)在相干通信、传感、加工等方面都有广泛的应用前景。本文以高功率单频Er/Yb共掺光纤MOPA和高能量脉冲掺Yb3+光纤MOPA为研究对象,针对光纤放大器中的非线性效应和ASE抑制技术展开研究工作,具体内容如下:1.搭建了全光纤结构的高功率单频Er/Yb共掺光纤MOPA系统。采用三级包层泵浦光纤放大器对波长为1550 nm的
基础设施是城市发展和人类福祉提升的物质基础,但其建设、使用、报废过程也伴随着大量的物质和能量消耗,对本地以及跨区域的生态环境产生了深远的影响。以往研究中,由于精细空间数据以及物质跨区域流动信息匮乏,使得城市尺度物质代谢的时空格局演变以及跨区域生态环境影响研究十分有限。为解决上述问题,本研究以上海11类主要基础设施为例,基于遥感、地理信息、历史地图、统计、调研等多源数据,构建物质流(MFA)和地理信
目的:建立寒湿困脾型泄泻小鼠模型,以黏液屏障-肠黏膜菌群稳态-靶向氨基酸代谢探讨寒湿困脾型泄泻形成和藿香正气散干预的微生态机制,为寒湿困脾型泄泻的临床治疗提供实验证据。方法:(Ⅰ)人工气候箱模拟寒湿环境应激干预和藿香正气散“以方测证”法建立寒湿困脾型泄泻小鼠模型,以证候诊断主次症标准(如稀便率、腹泻指数、粪便含水量和腹温等)评估模型。(Ⅱ)大剂量混合抗生素灌胃破坏模型小鼠肠道菌群稳态,检测小鼠粪便
雨生红球藻是目前认为最适合大规模生产虾青素的微藻,主要养殖在我国的云南省。丽江程海地区是主要的雨生红球藻养殖基地之一,其水质环境偏碱、硬度高,对养殖螺旋藻非常有利,但对雨生红球藻的生长不利,成为限制雨生红球藻大规模养殖的因素。本研究利用褐藻酸钠对程海地区雨生红球藻养殖硬水进行软化,探究软化水对雨生红球藻养殖的影响。采用5%褐藻酸钠对雨生红球藻养殖硬水进行软化,探究褐藻酸钠的用量及作用时间对硬水中C
变压器是电力系统和牵引供电系统中最为核心的设备之一,其绝缘可靠性决定了整个系统能否安全稳定运行。局部放电监测是掌握变压器绝缘状态的重要手段,对局部放电源进行定位可以显著提高变压器运维效率,而超声波定位法是目前使用最广泛的定位方法之一。实际应用中,变压器局部放电源超声波定位法仍存在以下问题:1)由于工艺不良以及绝缘劣化的影响,变压器绝缘可能出现多处缺陷,导致在变压器内部会存在多个局部放电源,造成多源
语言景观研究主要关注城市公共空间各类标牌上语言的选择和使用问题。通过分析公共空间不同形式的语言表征,可以考察语言实践背后的选择动机、社会机制、意识形态、身份认同和语言权势等深层次的社会问题。香港1997年回归祖国以后,特区政府制定了“两文三语”的语言政策,即两种书面语和三种口语:中文、英文和粤语、普通话、英语。在“两文三语”语言政策的框架下,现今香港的语言景观有何种特点?标牌上的语言实践与语言政策
第一部分肥胖合并雌激素缺乏诱导骨丢失小鼠模型的建立与评价目的:本研究拟给予双侧卵巢切除术(Ovariectomy,OVX)后的小鼠高脂饮食(High-fat diet,HFD)喂养,建立肥胖合并雌激素缺乏模型,通过组织学、Micro-CT以及生物力学等方法观察并评价当肥胖合并雌激素缺乏时小鼠骨量、骨微结构及骨骼生物力学的变化。方法:将32只3月龄雌性C57BL/6小鼠随机分为四组(每组8只):1)
大学英语教育政策的发展研究,是顺应当前我国高等教育改革潮流,落实国家教育事业发展规划,培养高质量、国际化人才,推进教育开放与合作的必然要求。从理论上看,有利于丰富和发展我国大学英语教育政策的理论体系,指导和推动大学英语教育的学科建设;从实践上看,有利于改进和完善我国大学英语教育政策,规范和引领大学英语教学实践改革。关于大学英语教育政策,国内外学者业已开展了一定的研究。国外的研究涉及多个主题,如政策
猕猴桃属(Actinidia Lindl.)包含54个种和21个变种,共75个分类单元。目前商业化栽培的猕猴桃有中华猕猴桃、美味猕猴桃、毛花猕猴桃和软枣猕猴桃,其中中华猕猴桃、美味猕猴桃和毛花猕猴桃在中国的栽培适宜范围为黄河以南地区,该地区冬季低温一般不超过-10°C。近年来,猕猴桃种植面积不断扩大,其种植区域呈现逐年北移的趋势,北方冬季的极端低温导致猕猴桃容易遭受冻害,轻则造成减产,重则导致整个