基于本地差分隐私的多维数据统计研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lianghaiyanps3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据和信息技术不断发展,个人信息的隐私问题受到越来越多的关注,如何在数据发布、模型训练的同时保证其中的个人敏感信息不被泄露是当前面临的重大挑战。差分隐私以其严格的数学定义,可量化的隐私保护程度在保障用户数据安全方面得到广泛应用。传统的中心化差分隐私建立在可信第三方数据收集者的假设基础上,在服务器端对用户数据进行隐私处理,然而该假设在现实中不一定成立。受此启发,本地差分隐私被提出,其具有强隐私保护性,不仅可以抵御具有任意背景知识的攻击者,而且能够防止来自不可信第三方的隐私攻击,对敏感信息提供了更全面的保护。本文深入研究了本地差分隐私在数据统计发布场景与分布式机器学习场景下的应用,并针对现有算法模型的不足,分别提出基于本地差分隐私的多维数据统计发布方案和基于本地差分隐私的联邦学习模型,主要内容分别如下:在本地差分隐私统计数据发布场景下,针对数据维度高以及数据具有关联性的特点,提出了一种满足本地差分隐私的分布估计与均值估计算法,在较少通信代价与不分割隐私预算的情况下,对多维数据进行统一处理。具体来说,基于用户数据不同维度之间的关联性,将用户端数据作为键值数据进行处理,使整个系统隐私预算比顺序组合性计算的隐私预算更小。通过加权随机采样、本地扰动、数据上传、数据聚合、数据发布等步骤,发布满足本地差分隐私的数据统计信息。与已有方案相比,本方案在用户本地数据量较大的情形下,使用加权随机采样算法只需要扫描一遍用户本地数据集,在保证数据可用性和隐私保护级别的前提下,提高了数据发布效率,且用户可根据自身隐私偏好对不同数据赋相对权值,对于隐私性越强的数据赋予更小的权值,以实现被随机采样到的概率更小,满足用户细粒度隐私保护需求。在本地差分隐私分布式联邦学习场景下,针对全局参数泄露以及多维梯度上传通信代价高的问题,提出了一种满足本地差分隐私扰动机制的联邦学习模型,其设计基于横向联邦学习系统架构,联邦学习的各个参与者具有特征空间相同的本地数据集。模型主要包括中心服务器分发全局参数、本地训练、本地梯度更新、梯度扰动、梯度上传、更新全局参数等步骤。通过本地差分隐私梯度扰动为梯度保护提供严格的隐私保证,中心服务器聚合扰动梯度后求解梯度均值来更新全局模型。与已有方案相比,本文提出的方案更加稳定,能够很好地解决误差偏大等问题,在图像分类任务和经验风险最小化任务的实验验证了该框架的隐私性和有效性。
其他文献
虚词一直是国际中文教学的重点和难点,加强虚词偏误分析将有助于国际中文教学发展。不过在目前的科学研究中,关于虚词的偏误分析多聚焦于副词、介词、连词分析等,连词偏误分析中关于并列连词的研究学界已有许多成果,但是系统地对留学生中极易出现混淆的汉语中的“和”类并列连词与英语中相对应的并列连词and研究较少,因此本文主要以英语背景留学生“和”类并列连词为研究对象,基于HSK动态作文语料库,笔者选取并确定了加
学位
饮食文化做为中华传统文化的重要组成部分,具有丰富的表现形式和深刻的文化底蕴,在汉语国际教育中开展饮食文化教学,能够让以汉语作为第二语言的学习者了解中国人的饮食特点、饮食方式、饮食习惯,饮食文化反映出了中国人的价值观念、思维方式和文化心理。因此,学生学习饮食文化,不光可以学习汉语的本体知识,还可以正确对待文化差异,避免跨文化冲突,进行有效的跨文化交际。川菜菜名蕴含着深刻的文化内涵,以菜名为饮食文化教
学位
现有分布式机器学习有两种热门框架,分别是基于边缘计算的模型训练和联邦学习。由于分布式机器学习固有的局限性,基于这两种框架构建的全局模型都容易受到投毒攻击的影响,因此,本文针对以上两种场景的特点,对现有方案存在的不足进行了改进和创新。随着边缘计算架构在车联网中的广泛应用,在云或边缘上基于收集的车辆数据来建立攻击检测模型已成为了车联网安全防护的重要手段。现有基于云平台的全局模型存在将边缘的错误进行全网
学位
抗美援朝是我国近代史上意义非凡的战争。204万中国人民志愿军远赴朝鲜,在2年9个月内遏制了美军侵略朝鲜的势头。不仅保障了新中国的平稳发展,还助推了世界和平。习总书记指出,社会各界都应学习这段历史,继承和发扬抗美援朝精神。《人民日报》具有高知名度和代表性,它记录了中国人民生活、建设、发展的历史。之前《人民日报》的相关研究中,战争题材多集中于抗日战争、南京大屠杀等事件,对抗美援朝战争的研究比较少,且主
学位
阿尔茨海默症(AD,Alzheimer’s disease)是一种起病隐匿、进行性发展的神经系统退行性疾病。患者多在老年发病,认知功能的退化速度远高于正常老化进程。阿尔茨海默症为患者及家人带来了极大的痛苦和经济压力,也为整个社会带来了极大的负担。对于阿尔茨海默症,临床上往往依靠一系列量表评估诊断,不仅医生的工作量剧增,且诊断的结果具有主观性。由于阿尔茨海默症病程较长,当临床上出现症状时往往已经发展
学位
中国自改革开放以来,在国际中的地位逐渐增强。中国在打开国门的同时,一方面与世界各国接轨,名声远扬,享誉国际;另一方面,中国在帮助别国的同时,被“有心人”认为是在谋求地区霸权和全球霸权,因此,中国在世界上的形象饱受争议。中国要想在国际上站稳脚跟,让世界各国人民认识到一个真实、立体、客观的国家,我们必须从自身出发,注重本国国家形象的塑造,将习近平主席“讲好中国故事,传递好中国声音”的重要讲话真正落实到
学位
发挥中国优势,建设具有中国特色的金融市场,解决民营企业的融资难问题一直是中国学术界关注的一个重要研究方向。中国悠久的文明史孕育了博大精深的传统文化。其中,发源于明清时期的商帮文化影响着中国的商业发展,构筑了中国人极具特色的营商思想。本文运用文献研究法、扎根理论编码、多案例研究法、多元回归分析法等研究方法,剖析商帮文化与中国民营企业融资约束之间的关系,为建设中国特色金融市场,解决民营企业融资问题提供
学位
在重大体育赛事中,体育明星的形象会影响其国家形象,塑造健康正面的体育明星形象不但有助于我国国家形象的宣传,而且还会为国人提供正确的价值导向。《人民日报》作为党媒具有较大影响力,微博作为即时性通讯平台降低了传播的成本,扩大了传播的范围,所以本研究以《人民日报》官方微博为研究对象,选取其在东京奥运会期间(2021年7月23日-2021年8月23日)发布的有关体育明星的334条微博报道作为分析样本,综合
学位
随着“一带一路”等倡议的提出,以及中国的国际地位和国际影响力的提高,旅居中国的外国人越来越多。2020年开展的第七次全国人口普查显示,我国不包括因出差、旅游等原因短期停留的外籍人员有845697人。家庭语言规划是语言规划中一个愈发受到重视的研究热点,通过调查外籍人员家庭的家庭语言规划,可以了解他们对学习中文的态度,以及他们的家庭语言规划与一系列的语言、文化、社会政治等因素的互动关系,以及找到提高在
学位
“国潮”之势自2018年元年开启,在近几年间迅猛发展。“国潮”成为时下最新的时尚文化潮流。本土品牌借着国潮崛起的趋势,把握机遇迅速发展,文创行业也随之不断壮大。“国潮”是一种历史悠久的精神力量,它是建立在中国文化基础上的小众文化。国风突破陈规,以新老相融,突破传统思维,开启了文化发展的新局面。故宫文化是中华文明的核心组成部分之一,它使中国的优秀文化得以生生不息。故宫博物院作为中国最大的博物馆,承担
学位